快捷导航
翻页抓取时,怎么一直在重复抓取一页?
举报 使用道具
| 回复

共 1 个关于本帖的回复 最后回复于 7 天前

bowieD 中级会员 发表于 7 天前 | 显示全部楼层
检查是否勾选了重复内容中断,如果没勾选爬虫就会一直抓取最后一页不会停。

解决:
在DS打数机上面选项中-高级-终点标志-重复内容,最后勾上重复内容就可以了,爬虫抓取三次完全一样的xml文件之后就会中断,我们可以通过excel对重复的结果文件进行去重处理
6.jpg
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 爬wish等瀑布流网站时使用清除老数据功能
  • 从淘宝的买家评论中,能挖掘出什么有用的信
  • 连续动作:如何把抓到的信息与动作步骤对应
  • 淘宝开店运营十大攻略
  • 深圳市咨询投诉分析

热门用户

集搜客GooSeeker网络爬虫 ( 粤ICP备11065265号-2 )

GMT+8, 2017-10-20 14:59