|
集搜客网络爬虫都有这些功能。
做规则时禁止跳转,集搜客有多种手段:
1)MS谋数台或者GS爬虫浏览器工具条中部的“内容定位”,勾上以后,点击超链接或者其他元素就不会发生跳转
2)MS谋数台或者GS爬虫浏览器的菜单 规则-》冻结页面,勾上以后,就会禁止js的运行,这样就能确保在做规则的时候js不要修改网页内容
抓取时提高速度
1)DS打数机菜单 配置-》配置浏览器,能看到 加载图片,加载js等
如果使用集搜或者单搜这种手动启动的爬虫,DS打数机菜单设置的选项是有效的。如果运行爬虫群模式,请到会员中心-》规则管理那里设置调度参数
|
|