快捷导航
import requests
from hyper.contrib import HTTP20Adapter

url = 'https://www.pexels.com/search/dog/'
kw = {
    ':authority': 'www.pexels.com',
    ':method': 'GET',
    ':path': '/search/dog/',
    ':scheme': 'https',
    'accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.9',
    'accept-encoding': 'gzip, deflate, br',
    'accept-language': 'az',
    'sec-fetch-dest': 'document',
    'sec-fetc`h-mode': 'navigate',
    'sec-fetch-site': 'none',
    'upgrade-insecure-requests': '1',
    'user-agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.88 Safari/537.36',

}

try:
    requests.packages.urllib3.disable_warnings()

    sessions = requests.session()
    sessions.mount('https://www.pexels.com', HTTP20Adapter())
    r = sessions.get(url, headers=kw)

    r.raise_for_status()
    r.encoding = r.apparent_encoding
    print(r.text)
except Exception as err:
    print(err)
    print("========")#只想得到 这个静态html https://www.pexels.com/search/dog/ 这个地址返回的 response  不问别的问题。
举报 使用道具
| 回复

共 3 个关于本帖的回复 最后回复于 2021-4-26 09:43

内容分析应用 金牌会员 发表于 2021-4-26 08:50:25 | 显示全部楼层
你看看是不是header里面有什么参数不对
举报 使用道具
gdlbbxzsc 新手上路 发表于 2021-4-26 09:30:17 | 显示全部楼层
内容分析应用 发表于 2021-4-26 08:50
你看看是不是header里面有什么参数不对

我已经将 所有的header 都复制过来了 还是不行,另外我能力有限实在看不出 是那里出了问题。如能解答 不胜感谢
举报 使用道具
gdlbbxzsc 新手上路 发表于 2021-4-26 09:43:39 | 显示全部楼层
gdlbbxzsc 发表于 2021-4-26 09:30
我已经将 所有的header 都复制过来了 还是不行,另外我能力有限实在看不出 是那里出了问题。如能解答 不 ...

另外这个 问题 已经研究了几天了,在一些qq技术群里 也讨论过 很多人 都没整通过。不知道为什么
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Jupyter Notebook使用Python做K近邻(KNN)算
  • 基于层次结构和共现关系的在线评论主题图谱
  • 基于因果机制的用户行为研究及应用
  • 改进的K近邻算法及其在文本分析中的应用
  • Jupyter Notebook使用Gensim库做中文Word2V

热门用户

GMT+8, 2021-9-22 15:44