免费网络信息采集软件工具包MetaSeeker V4.3.2稳定运行了三个多月,由外界看来,这段时间是GooSeeker的沉默期,事实上,GooSeeker开发团队集中所有骨干成员,对MetaSeeker进行了一次重大改进,主要的改进目标是提高信息采集性能和可靠性。今天,V4.10.0正式发布,这是从V4版本向V5版本跃进的跳板,昭示着MetaSeeker正式进入高性能时代,可以很好地满足垂直搜索和商业情报分析等海量信息采集需求。此次改进还在进一步深化中,到V5版本正式发布时,MetaSeeker企业版服务器也将升级成高性能版本。V4.10.0主要改进集中在DataScraper软件中,体现在:
- 提高网络通信效率:MetaSeeker采用基于XML/HTTP的SOA架构,所有部件之间都采用HTTP协议进行通信,V4.10.0修改了通信调度策略,高效地利用网络带宽。
- 提高网络通信的可靠性:XML/HTTP通信和目标网页加载过程都进行了监控,采用多种故障恢复机制,例如,HTTP消息重发、目标网页重新加载、超时监控等等。
- 增加并行的DataScraper线程数量:当运行自动的周期性网络信息采集任务时,以前版本只能运行不超过6个DataScraper线程,新版本不再有这个限制,可以运行大量并发线程,充分利用CPU处理能力。
请免费登录MetaSeeker自助服务开通系统下载最新MetaSeeker版本。请阅读安装手册选择合适的配套版本。