抓取规则
集搜客网络爬虫的用户不用手工编写爬虫程序(抓取规则),MS谋数台能自动生成,用户只需在网页上做直观标注或者是信息的映射操作,点击“测试”按钮就能自动生成数据规则和输出信息,如果测试结果达到预期,点击“存规则”后再点“爬数据”,交给DS打数机运行这个规则,就能采集信息,还可以用这个规则添加更多网址,批量采集同类型的网页。 |
oubinke: 那是不是有一种并行操作的意思呢?那同时抓取同一个主题的话,所得到的结果会不会重复呢
bowieD: 每一个规则都可以用一个集搜窗口来运行采集,“与原来的管理窗口同时抓取网页数据”的意思是 是集搜窗口与管理窗口同时抓取同一个主题的网页数据。 ...
oubinke: “点击主题的“集搜”按钮后,弹出“抓取网页”会话窗口,设置抓取线索数量并确定后,将会自动弹出新的简化版DS打数机窗口(集搜窗口),与原来的管理窗口同时抓 ...
a12345617: 什么工具,一点都不会。完全不知道要干什么
waq0902: 单搜和集搜的设置线索数是什么意思?什么情况下线索不是1?