网络采集软件系统DataScraper从V4.10.0版本开始分成了高性能版和普通版,只在过渡期存在两个版本,因为新的高性能版本的架构和编程语言(C++)都与老版本不同,必然有很多bug,所以,两个版本并行,当遇到某bug时,用户可以暂时选择普通版本而不至于等待bug的修改。最终将只有高性能版本。
在V4.10.0高性能版中有一个bug,如果网络采集规则定义软件系统MetaStudio(请在GooSeeker网站下载)没有定义网页内容采集规则,而仅仅定义超链接采集规则,也就是说,光采集URL地址,DataScraper无法采集,在日志文件(位于$HOME/.datascraper/datascraper.log.txt)中可以看到ERROR类信息。
如果您恰好安装了DataScraper V4.10.0高性能版,有下面多个途径解决该问题:
- 联系我们,我们可以给您发送一个V4.10.1版本,该版本没有发布在软件下载服务器上,因为,V4.11.0版本在近期就要推出。或者,
- 使用DataScraper V4.10.0普通版,等待V4.11.0版本。或者,
- 总是在Bucket Editor工作台上定义几个内容提取规则,即使这些内容并不需要。