集搜客GooSeeker独立爬虫软件(Beta版)上线了,你在使用的过程中碰到问题可以在这里进行反馈与互动交流

Beta版说明:
1,因为还在beta测试阶段,程序设置了很多日志输出开关,所以运行速度要比火狐插件版稍微慢一点。
2,选用的场景:请尽量选择火狐插件版。但是只与Firefox 38.x版本配套,如果您已经安装了更高版本的火狐,而且不想替换成Firefox 38,则可以选择GooSeeker独立爬虫软件。

Beta版功能限制:
1,爬虫功能代码其实是一套,也就是说火狐插件版和独立软件版的爬虫功能是一样的
2,功能受限的原因是独立软件版的浏览器引擎还没有全功能放开,不要体现在:
  • 如果抓取https网站,而且这个网站的证书没有经过认证,那么独立软件的浏览器引擎将拒绝访问
  • 抓取PDF内容:参看 http://www.gooseeker.com/doc/article-257-1.html ,浏览器插件版能像抓取html网页一样解析和抓取pdf内容,独立软件版没有解析pdf
  • 独立软件版的部分对话框的按钮是英文的
  • 独立软件版暂时没有提供设置界面,无法通过管理界面清cookie和更改agent

举报 使用道具
| 回复

共 4 个关于本帖的回复 最后回复于 2016-8-8 14:53

沙发
Fuller 管理员 发表于 2016-5-18 12:02:09 | 只看该作者
所谓独立软件,就是不再作为Firefox的插件,而是一个独立的exe程序。
举报 使用道具
板凳
Fuller 管理员 发表于 2016-8-5 21:33:13 | 只看该作者
正式改名 GS爬虫浏览器
举报 使用道具
地板
ronens 初级会员 发表于 2016-8-8 14:05:29 | 只看该作者
等正式版
举报 使用道具
5#
Fuller 管理员 发表于 2016-8-8 14:53:58 | 只看该作者

那是上个月的公告,现在已经是第二版了,就是正式版本。
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-20 09:01