按照教程设定了连续动作,但抓取总是中断
规则名是“新制造网”
样例页是“http://www.xzhizao.com/search?q=%E8%9E%BA%E4%B8%9D&x=0&y=0&act=order”

举报 使用道具
| 回复

共 4 个关于本帖的回复 最后回复于 2019-8-20 19:13

czj19961023 实习版主 发表于 2019-8-20 14:23:27 | 显示全部楼层
本帖最后由 czj19961023 于 2019-8-20 14:24 编辑

网页是瀑布流网页,采集参照这个教程加个清除老数据采集就不会中断了。
举报 使用道具
dingzha 中级会员 发表于 2019-8-20 15:17:07 | 显示全部楼层
加“清除老数据”还是不行....
举报 使用道具
Fuller 管理员 发表于 2019-8-20 19:10:11 | 显示全部楼层
dingzha 发表于 2019-8-20 15:17
加“清除老数据”还是不行....

首先,清除老数据只有旗舰版才能用。其次,清除老数据是为了尽量减少重复数据。至于中断,要具体分析。我加载分析一下你的规则看看
举报 使用道具
Fuller 管理员 发表于 2019-8-20 19:13:38 | 显示全部楼层
我没有搜到这个规则,删除了?
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-29 03:53