本帖最后由 Anna J 于 2015-12-25 11:32 编辑

       我相信很多用户会有这样的场景:一个网站需要做好几个规则,才能采完想要的东西。
       比如淘宝的商品数据,一要在列表页面定义一个规则,二要点击商品链接后定义规则采集宝贝详情,三要跳转到评论页签采集评论。规则是很快写好了,等待输出结果可真是叫人难受。
       量大的时候一个规则要花好几个小时才能采完,每个规则需要的时间我又是不确定的,只能一边干其他工作一边观察DS打数机的进程,一个规则跑完了再手动运行下一个规则。
       有了新上线的爬虫群功能,您只需要专心做规则,然后把做好的规则丢到调度池它们会自己运行,您就等着收割数据吧!
         更多关于“爬虫群”请见http://www.gooseeker.com/doc/article-200-1.html


举报 使用道具
| 回复

共 4 个关于本帖的回复 最后回复于 2016-9-15 14:59

沙发
Fuller 管理员 发表于 2015-12-22 15:48:41 | 只看该作者
收割数据,好
举报 使用道具
板凳
xandy 论坛元老 发表于 2015-12-22 17:59:14 | 只看该作者
数据收割机哪家强?
举报 使用道具
地板
Fuller 管理员 发表于 2015-12-22 22:29:54 | 只看该作者
xandy 发表于 2015-12-22 17:59
数据收割机哪家强?

“爬虫嘛,就是也叫采集器的小程序”这个观念需要改变了,GooSeeker的爬虫群是一台“联合收割机”
举报 使用道具
5#
lynn000000 初级会员 发表于 2015-12-23 15:27:39 | 只看该作者
好的, 等在迭代几个版本 ,我就来学习爬虫群 ,现在嘛 ,怕有小八哥, 等稳定了再来收割大家的成果
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法
  • 利用AI阅读和分析文本:扣子COZE记录用户反
  • 在网页片段内直观标注——以B站评论采集为
  • 利用AI阅读和分析文本:使用COZE建设游记文

热门用户

GMT+8, 2024-12-24 07:11