快捷导航
翻页抓取时,怎么一直在重复抓取一页?
举报 使用道具
| 回复

共 1 个关于本帖的回复 最后回复于 2017-10-13 18:07

bowieD 高级会员 发表于 2017-10-13 18:07:41 | 显示全部楼层
检查是否勾选了重复内容中断,如果没勾选爬虫就会一直抓取最后一页不会停。

解决:
在DS打数机上面选项中-高级-终点标志-重复内容,最后勾上重复内容就可以了,爬虫抓取三次完全一样的xml文件之后就会中断,我们可以通过excel对重复的结果文件进行去重处理
6.jpg
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 百度推广后台数据DIY
  • 采集表单中的input动态内容
  • 采用刷新动作实现手机页面采集
  • 通过划定滚轮范围实现精确点击手机页面
  • 放大或者缩小页面便于采集手机网页内容

热门用户

集搜客GooSeeker网络爬虫 ( 粤ICP备11065265号-2 )

GMT+8, 2017-12-18 18:49