注:集搜客GooSeeker爬虫从V9.0.2版本开始,爬虫术语“主题”统一改为“任务”,在爬虫浏览器里先命名任务再创建规则,然后登录集搜客官网会员中心的“任务管理”里,就可以查看任务的采集执行情况、管理线索网址以及做调度设置了。 我们做好规则后,可以在会员中心调度规则,用爬虫群自动采集数据,采集完成后,直接在会员中心导出EXCEL格式的数据。操作步骤如下 一、进入会员中心 在Gooseeker浏览器登录集搜客官网https://www.gooseeker.com,进入会员中心->任务管理。 二、设置自动导入 选择对应任务名,对这个任务进行调度设置。 三、运行爬虫群 紧接着上一步,会提示调度参数设置成功,这时候点击“启动爬虫群” 可以看到两个爬虫窗口启动起来,开始采集数据。(注:爬虫窗口也称之为打数机窗口) 四、导出数据 采集完成后,在会员中心选中 数据->导出数据。 |