rt
举报 使用道具
| 回复

共 4 个关于本帖的回复 最后回复于 2018-5-23 18:28

沙发
shengchengx 金牌会员 发表于 2018-5-23 17:30:19 | 只看该作者
是否打开爬虫群窗口?只有在打开了爬虫群窗口之后,激活之后才会去进行抓取,不然的话只是激活线索没有进行抓取数据呢。
举报 使用道具
板凳
maomaotest3 初级会员 发表于 2018-5-23 17:53:31 | 只看该作者
怎么打开爬虫群窗口呢?具体怎么操作?
举报 使用道具
地板
Fuller 管理员 发表于 2018-5-23 18:20:23 | 只看该作者
maomaotest3 发表于 2018-5-23 17:53
怎么打开爬虫群窗口呢?具体怎么操作?

要运行起来一个或多个爬虫群窗口。方法是:
a,在DS打数机界面上有菜单 爬虫群-》配置或者启动,配置几个爬虫群窗口,然后启动起来。这种爬虫群窗口就能等待分配抓取任务了。
b,另一个方法就是在快捷采集和微博采集工具箱的界面上都有启动爬虫按钮,如果这些页面使用集搜客浏览器访问的,那么,可以直接从页面上点击启动按钮把爬虫群窗口启动起来
举报 使用道具
5#
Fuller 管理员 发表于 2018-5-23 18:28:53 | 只看该作者
如果爬虫群窗口已经启动了,但是一直没有任务,要检查:
1,是不是没有线索了?每个网址采集一遍以后,就不能再次采集了,如果还想再次采集,需要激活线索。在规则管理那里有激活线索按钮
2,运行起来的爬虫窗口是不是爬虫群窗口。DS打数机有多种窗口类型
a,从集搜客浏览器的工具条上,点击“DS打数机”按钮,启动起来的是DS打数机管理窗口,这个窗口功能最全,也可以采集数据
b,在定义规则模式下,点击“爬数据”按钮,启动起来的是DS打数机测试窗口,功能要比管理窗口少
c,点击“集搜”按钮,启动起来的是集搜窗口,没有菜单和主题列表,只能采集数据
d,爬虫群窗口:是在管理窗口上使用爬虫群菜单启动起来的,也可以从快捷采集和微博工具箱的页面上启动。这种窗口才能自动分配采集任务。

所以,要检查一下爬虫群窗口是否启动起来了
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-26 14:09