主题:案例借贷
问题:通过“查看更多“显示下一页,读取到中间就显示”采集完成“,怎么破?是反爬的原因还是其他的?
举报 使用道具
| 回复

共 5 个关于本帖的回复 最后回复于 2017-8-8 14:45

沙发
wangyong 版主 发表于 2017-8-8 11:58:45 | 只看该作者
翻页到中间显示“采集完成”,原因是爬虫在新翻到的那一页没有找到翻页记号,所以认为采集成功
检查翻页中断的那页和第一页有什么区别,重新修改规则,参看教程《翻页到中间就失败了怎么解决》
举报 使用道具
板凳
ovna123 金牌会员 发表于 2017-8-8 14:22:23 | 只看该作者
由于是瀑布流,不太容易找到出问题的页面。不过我试了两次,有个特点,第一次出问题的页和第二次的不一样,是不是就是说还是被网站限制了?
举报 使用道具
地板
wangyong 版主 发表于 2017-8-8 14:26:51 | 只看该作者
有这个可能,可以尝试清cookie换IP
举报 使用道具
5#
wangyong 版主 发表于 2017-8-8 14:29:17 | 只看该作者
打数机配置里的定时器触发可以关掉
举报 使用道具
6#
ovna123 金牌会员 发表于 2017-8-8 14:45:19 | 只看该作者
好的,谢谢!
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-26 13:05