粘贴的网址页面部分内容与在浏览器打开的不同,比如知乎登陆后才有显示浏览数,但导入网址后就没有这一部分。这应该怎么做才能让他们一致?

举报 使用道具
| 回复

共 1 个关于本帖的回复 最后回复于 2016-11-3 11:33

沙发
Fuller 管理员 发表于 2016-11-3 11:33:09 | 只看该作者
如果仅仅是登录与否造成的差异,这个好处理,现在爬虫所在的浏览器上登录,再运行爬虫。

也有个别网站,在GS爬虫浏览器上显示的内容布局和火狐浏览器上不一样,比如,google的购物搜索和图片搜索,要抓取这样的网站,暂时选用火狐版集搜客爬虫,Gs爬虫浏览器的显示问题还需要诊断。
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-3 00:55