快捷导航
翻页抓取时,怎么一直在重复抓取一页?
举报 使用道具
| 回复

共 1 个关于本帖的回复 最后回复于 2017-10-13 18:07

bowieD 金牌会员 发表于 2017-10-13 18:07:41 | 显示全部楼层
检查是否勾选了重复内容中断,如果没勾选爬虫就会一直抓取最后一页不会停。

解决:
在DS打数机上面选项中-高级-终点标志-重复内容,最后勾上重复内容就可以了,爬虫抓取三次完全一样的xml文件之后就会中断,我们可以通过excel对重复的结果文件进行去重处理
6.jpg
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 批量爬取蘑菇街商品价格、评论信息
  • 微博用户数据分析
  • 批量爬取苏宁商品价格、评论信息
  • 批量爬取亚马逊商品价格、评论信息
  • 批量爬取eBay商品价格、销售情况信息

热门用户

集搜客GooSeeker网络爬虫 ( 粤ICP备11065265号-2 )

GMT+8, 2018-7-18 02:47