集搜客网页抓取软件是基于火狐浏览器开发的,火狐插件版爬虫目前只支持火狐企业版38。 另外,从v6.0.0版就推出了GS爬虫浏览器软件,安装过火狐插件版爬虫的用户也可以安装GS爬虫浏览器。新用户请先去集搜客网站上注册账号,用于登录集搜客爬虫软件,老用户直接用火狐访问集搜客官网的产品版块,下载软件更新就可以了。目前windows操作系统的爬虫安装有以下三种方案,如下图。Mac操作系统请参考Mac版爬虫安装。 一、安装说明: 1. 没有火狐浏览器的用户可以选择任意一种安装方案,建议选择方案1或方案2,一键安装操作简单,双击就可以自解压安装。 2. 有火狐浏览器的用户,请点击火狐的帮助菜单->关于Firefox,查看火狐版本是否符合浏览器版本要求(38版火狐)。 2.1 如果不符合,就可以选择方案1,下载GS爬虫浏览器软件进行一键安装。 2.2 如果符合火狐的版本要求,就选择方案3下载一个爬虫插件。用火狐打开集搜客官网,点击“立即下载”,解压安装包zip后,把xpi文件拖动到火狐浏览器窗口里进行安装,如下图。 2.2.1 点击“立刻安装”开始安装集搜客软件,如下图。 2.2.2 安装完毕会提示重启火狐浏览器,确定重启后就完成安装了,如下图。 二、运行软件1. 安装火狐插件版爬虫的用户,请打开火狐浏览器,点击工具菜单栏,就会看到MS谋数台和DS打数机,或者是点击工具条右边的MS图标和DS图标。如果没看到菜单栏,请右击火狐浏览器顶部,勾选“菜单栏”设置。 注意:为了保持火狐与爬虫版本配套使用,需要禁止火狐浏览器升级,操作:火狐浏览器的工具菜单->选项->高级->更新->不检查更新。 2. 安装GS爬虫浏览器软件的用户,请双击打开软件,在右上角就能看到定义规则、MS谋数台和DS打数机,其中定义规则可以直接对当前页面做规则,非常简便好用,再次点击就可以取消做规则。 3. 第一次运行MS谋数台/DS打数机时/GS爬虫浏览器,要登录才能正常使用。注意:没有账号的请先在官网注册一个账号,并且要通过邮箱验证才能正常使用。
三、安装环境介绍硬件环境 为了获得集搜客爬虫软件的最优显示效果和准确的采集结果,建议电脑显示器分辨率在1280×1024以上。因为集搜客爬虫是通过内嵌浏览器模拟人工浏览网页的操作,从而有效提取网页信息。如果电脑的纵向分辨率小于1024(例如笔记本),内嵌浏览器的显示尺寸过小,就会影响操作的便利性以及网页信息显示的完整性。 如果是笔记本电脑,使用MS谋数台操作不便利时,可以通过调整工作台布局以获得更好的体验,操作:打开MS谋数台后,点击工具栏->“移动工作台” 或者 “配置”菜单->“界面布局”->“移动工作台”。另外,笔记本使用DS打数机采集,需要把浏览器扩大为全屏采集。 软件环境 集搜客爬虫软件支持windows/linux/mac三个操作系统,大家可以选择安装火狐插件版爬虫或者是安装GS爬虫浏览器来使用。 |