下级采集,将两个规则都放入爬虫群中,一级规则与下级规则同时采集,但是下级规则只采集到一部分线索。试了几次还是这样。。。
怎么才能两个规则同时运行,第一级规则采集数据后,下级规则就继续采集呢?

举报 使用道具
| 回复

共 3 个关于本帖的回复 最后回复于 2017-4-26 10:13

沙发
shengchengx 金牌会员 发表于 2017-4-26 10:12:55 | 只看该作者
有线索就会采的,爬虫群不能规定一个窗口运行某个规则
你把两个规则都调度了 程序会自动选择,可能会出现两个窗口都运行第一级的情况
但是只要爬虫群窗口还在 规则还有线索 就会一直跑

举报 使用道具
板凳
黄黄黄辉 初级会员 发表于 2017-4-26 10:13:16 | 只看该作者
shengchengx 发表于 2017-4-26 10:12
有线索就会采的,爬虫群不能规定一个窗口运行某个规则
你把两个规则都调度了 程序会自动选择,可能会出现两 ...

恩恩,她是调度的。可是第一级采集完了,下级规则就采集了一部分
举报 使用道具
地板
shengchengx 金牌会员 发表于 2017-4-26 10:13:49 | 只看该作者
黄黄黄辉 发表于 2017-4-26 10:13
恩恩,她是调度的。可是第一级采集完了,下级规则就采集了一部分

去统计线索,还有些是重复的,程序会自动对线索去重
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-2 18:22