import requests
from hyper.contrib import HTTP20Adapter

url = 'https://www.pexels.com/search/dog/'
kw = {
    ':authority': 'www.pexels.com',
    ':method': 'GET',
    ':path': '/search/dog/',
    ':scheme': 'https',
    'accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.9',
    'accept-encoding': 'gzip, deflate, br',
    'accept-language': 'az',
    'sec-fetch-dest': 'document',
    'sec-fetc`h-mode': 'navigate',
    'sec-fetch-site': 'none',
    'upgrade-insecure-requests': '1',
    'user-agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.88 Safari/537.36',

}

try:
    requests.packages.urllib3.disable_warnings()

    sessions = requests.session()
    sessions.mount('https://www.pexels.com', HTTP20Adapter())
    r = sessions.get(url, headers=kw)

    r.raise_for_status()
    r.encoding = r.apparent_encoding
    print(r.text)
except Exception as err:
    print(err)
    print("========")#只想得到 这个静态html https://www.pexels.com/search/dog/ 这个地址返回的 response  不问别的问题。
举报 使用道具
| 回复

共 3 个关于本帖的回复 最后回复于 2021-4-26 09:43

沙发
内容分析应用 金牌会员 发表于 2021-4-26 08:50:25 | 只看该作者
你看看是不是header里面有什么参数不对
举报 使用道具
板凳
gdlbbxzsc 新手上路 发表于 2021-4-26 09:30:17 | 只看该作者
内容分析应用 发表于 2021-4-26 08:50
你看看是不是header里面有什么参数不对

我已经将 所有的header 都复制过来了 还是不行,另外我能力有限实在看不出 是那里出了问题。如能解答 不胜感谢
举报 使用道具
地板
gdlbbxzsc 新手上路 发表于 2021-4-26 09:43:39 | 只看该作者
gdlbbxzsc 发表于 2021-4-26 09:30
我已经将 所有的header 都复制过来了 还是不行,另外我能力有限实在看不出 是那里出了问题。如能解答 不 ...

另外这个 问题 已经研究了几天了,在一些qq技术群里 也讨论过 很多人 都没整通过。不知道为什么
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-2 05:15