规则名--》cq初中1      规则2--》cq初中2        这个之前跑过一次 可是跑的数据少 我有重新跑的 这次数据正好不好  我把规则2的线索都撤销了  跑完规则1  查看规则2 待抓取2481条  抓取完成29条 我根本没运行 求答
举报 使用道具
| 回复

共 4 个关于本帖的回复 最后回复于 2016-12-9 08:49

沙发
wsj521 初级会员 发表于 2016-12-8 17:38:55 | 只看该作者
我不想激活完成的线索  应为我的数据需要采取的先后顺序  
举报 使用道具
板凳
ym 版主 发表于 2016-12-8 17:46:34 | 只看该作者
你有设置过这两个规则的爬虫群调度吗?
你去本地的datascraperworks文件夹里,看看第二级主题有没有刚爬到的xml文件吧
举报 使用道具
地板
wsj521 初级会员 发表于 2016-12-8 17:53:38 | 只看该作者
ym 发表于 2016-12-8 17:46
你有设置过这两个规则的爬虫群调度吗?
你去本地的datascraperworks文件夹里,看看第二级主题有没有刚爬到 ...

我运行了2遍规则1  然后查看规则2的线索数量 都是这样的  没运行爬虫群
举报 使用道具
5#
shenzhenwan10 金牌会员 发表于 2016-12-9 08:49:39 | 只看该作者
仅根据你的描述, 难以判断你说的20个已完成线索怎么来的, 需要你自己做一些操作来进一步分析
你可以到会员中心, 把规则2的线索都删除掉
然后再运行规则1, 运行完成后, 查看规则2的线索状态
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-19 21:12