规则名:
虾皮全店铺详情_点规格
虾皮全店铺详情_内容
虾皮全店铺详情_点主图
虾皮全店铺详情_抓主图

我运行时为什么一级规则的动作运行采集一次就继续下一级规则的动作采集呢。
我想实现一级规则动作所有采集完了之后,再开始下一级规则的采集。
设置了延时也没有用,只是增加了每一次动作采集的时间。
是哪里设置的问题吗?

举报 使用道具
| 回复

共 5 个关于本帖的回复 最后回复于 2017-7-15 20:33

沙发
shengchengx 金牌会员 发表于 2017-7-14 17:23:52 | 只看该作者
你的规则这边因为一级,二级,后面都会有连续动作,所以他会在做完一级中的点击动作后会跳到二级中,然后采集完了之后会运行二级的点击动作,如果你想把一级采集全部采集完了之后再去采集第二级的数据的话,那样就得分开制作规则,第二级里面就不要做连续动作了,然后在采集二级规则的时候就需要单独做一个一级规则、
举报 使用道具
板凳
zla520 初级会员 发表于 2017-7-14 17:33:00 | 只看该作者
意思是通过打数机分开来采集这两个动作吗? 如果分开来采集的话,很有可能最后一次采集到网页有更新的信息,在处理数据的时候条数就不对了。
举报 使用道具
地板
zla520 初级会员 发表于 2017-7-14 17:35:10 | 只看该作者
有没有一个办法让两个连续动作关联在一起来采集呢。
举报 使用道具
5#
wangyong 版主 发表于 2017-7-14 18:45:01 | 只看该作者
本帖最后由 wangyong 于 2017-7-14 18:46 编辑

如果是考虑时间不同采集到的数据不同的话
可以自定义设置crontab,不同区域的连续动作分别用不同的规则来做
crontab里的thread代表一个采集窗口,一个thread可以包含多个step,一个step代表一个规则,将不同区域的采集规则写在同一个thread里的不同step
在实际采集中就会采完第一个step里的规则立即采集第二个step里的规则
举报 使用道具
6#
zla520 初级会员 发表于 2017-7-15 20:33:32 | 只看该作者
wangyong 发表于 2017-7-14 18:45
如果是考虑时间不同采集到的数据不同的话
可以自定义设置crontab,不同区域的连续动作分别用不同的规则来做 ...

没理解你的意思。
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-3 02:07