本帖最后由 whusim 于 2017-10-2 13:46 编辑

在DS打数机里面单搜,然后又调度了爬虫群,然后调度的两个爬虫群都不动,只有单搜的界面在爬,这是怎么回事,而且爬虫速度好慢
现在在运行一级主题名(一级模拟点击“完整介绍”到二级页面-同一网址采集数据)

样本网址:http://www.haodf.com/doctor/DE4r08xQdKSLBZmGIpMEBi1InoYl.htm


一级主题名:b高血压医生列表_个人_信息主页
二级主题名:
b高血压医生列表_个人_信息主页二级                       
举报 使用道具
| 回复

共 4 个关于本帖的回复 最后回复于 2017-10-3 10:32

沙发
Fuller 管理员 发表于 2017-10-2 17:37:36 | 只看该作者
爬虫群还是调度不了吗?要在会员中心的规则管理那里设置调度参数
举报 使用道具
板凳
whusim 中级会员 发表于 2017-10-3 10:03:23 | 只看该作者
是在会员中心设置的,反应比较慢,可以了,谢谢
举报 使用道具
地板
Fuller 管理员 发表于 2017-10-3 10:30:56 | 只看该作者
whusim 发表于 2017-10-3 10:03
是在会员中心设置的,反应比较慢,可以了,谢谢

会员中心调度需要排队,现在用户比较多,排队有些慢,最近正在修改,期望排队时间不要超过半分钟
举报 使用道具
5#
Fuller 管理员 发表于 2017-10-3 10:32:35 | 只看该作者
设置的爬虫群模式,一批抓取的线索数不要太少,比如,50个以上,这样会花费比较长的时间。如果一批花费时间太短,排队还没有轮到几次,这一批就抓取完了,那么能轮到调度的爬虫窗口就会很少
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-3 02:32