我现在手里有个任务,有6万多条线索
我看教程说,可以开启20个爬虫群


我在打数机里设置了8个爬虫群,但只有一个dst打数机界面(难道这一个界面有8个爬虫群???),按常理来说不应该出现8个dst打数机采集界面吗???


还有,附带一个问题,我有两台电脑,可不可以一起登陆,然后一共开启40个爬虫群?

麻烦啦

举报 使用道具
| 回复

共 5 个关于本帖的回复 最后回复于 2019-8-15 15:24

wangyong 版主 发表于 2019-8-14 17:27:57 | 显示全部楼层
这个是启动爬虫群采集的教程:https://www.gooseeker.com/doc/article-474-1.html
1,一般正常配置的电脑建议开启6个爬虫群窗口,只要专门用来采集的高配电脑可以开20个窗口,普通电脑开这么多会崩溃
2,可以多台电脑登录同一账号加快采集速度,但是免费版只能同时登录一台电脑,爬虫群和单搜同时采集不会造成重复采集,爬虫群分配任务的策略是同一进程多线程,最终队列是没有重复的
举报 使用道具
657344626 初级会员 发表于 2019-8-15 09:09:46 | 显示全部楼层
wangyong 发表于 2019-8-14 17:27
这个是启动爬虫群采集的教程:https://www.gooseeker.com/doc/article-474-1.html
1,一般正常配置的电脑建 ...

哦哦!原来如此!谢谢!!!
举报 使用道具
657344626 初级会员 发表于 2019-8-15 11:04:14 | 显示全部楼层
wangyong 发表于 2019-8-14 17:27
这个是启动爬虫群采集的教程:https://www.gooseeker.com/doc/article-474-1.html
1,一般正常配置的电脑建 ...

你好,想问一下

您刚才说,单搜和爬虫群不会相互干扰
那集搜呢?

比如,一共1万条数据,集搜线索数设置1万的话,同时开启爬虫群
集搜的这一万条数据还是会一条条跑完对吗?这样的话,是重复的吧。。。
还是说,集搜的这一万条线索,爬到中途就会停止

举报 使用道具
Fuller 管理员 发表于 2019-8-15 11:33:04 | 显示全部楼层
657344626 发表于 2019-8-15 11:04
你好,想问一下

您刚才说,单搜和爬虫群不会相互干扰

不会重复,集搜窗口爬到一定程度,会发现没有线索了,就退出了
举报 使用道具
657344626 初级会员 发表于 2019-8-15 15:24:07 | 显示全部楼层
Fuller 发表于 2019-8-15 11:33
不会重复,集搜窗口爬到一定程度,会发现没有线索了,就退出了

好的!谢谢!!!
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-28 17:02