本帖最后由 Anna J 于 2015-12-25 11:32 编辑

       我相信很多用户会有这样的场景:一个网站需要做好几个规则,才能采完想要的东西。
       比如淘宝的商品数据,一要在列表页面定义一个规则,二要点击商品链接后定义规则采集宝贝详情,三要跳转到评论页签采集评论。规则是很快写好了,等待输出结果可真是叫人难受。
       量大的时候一个规则要花好几个小时才能采完,每个规则需要的时间我又是不确定的,只能一边干其他工作一边观察DS打数机的进程,一个规则跑完了再手动运行下一个规则。
       有了新上线的爬虫群功能,您只需要专心做规则,然后把做好的规则丢到调度池它们会自己运行,您就等着收割数据吧!
         更多关于“爬虫群”请见http://www.gooseeker.com/doc/article-200-1.html


举报 使用道具
| 回复

共 4 个关于本帖的回复 最后回复于 2016-9-15 14:59

Fuller 管理员 发表于 2015-12-22 15:48:41 | 显示全部楼层
收割数据,好
举报 使用道具
xandy 论坛元老 发表于 2015-12-22 17:59:14 | 显示全部楼层
数据收割机哪家强?
举报 使用道具
Fuller 管理员 发表于 2015-12-22 22:29:54 | 显示全部楼层
xandy 发表于 2015-12-22 17:59
数据收割机哪家强?

“爬虫嘛,就是也叫采集器的小程序”这个观念需要改变了,GooSeeker的爬虫群是一台“联合收割机”
举报 使用道具
lynn000000 初级会员 发表于 2015-12-23 15:27:39 | 显示全部楼层
好的, 等在迭代几个版本 ,我就来学习爬虫群 ,现在嘛 ,怕有小八哥, 等稳定了再来收割大家的成果
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-18 16:24