GooSeeker研发中心发布的MetaSeeker本身就是一款抓取网页内容并将其结构化存储的工具,GooSeeker网站有大量文档资料介绍MetaSeeker的原理,GooSeeker虽然也密切关注语义网络(Semantic Web)的发展动向,但是公开发布的MetaSeeker在线版更关注实用价值,相反国外的更多类似产品在网页内容结构化方面更进一步,本文介绍Solvent,它是语义网络项目Simile中的
GooSeeker研发中心发布的MetaSeeker本身就是一款抓取网页内容并将其结构化存储的工具,GooSeeker网站有大量文档资料介绍MetaSeeker的原理,GooSeeker虽然也密切关注语义网络(Semantic Web)的发展动向,但是公开发布的MetaSeeker在线版更关注实用价值,相反国外的更多类似产品在网页内容结构化方面更进一步,本文介绍Solvent,它是语义网络项目Simile中的
今天看到一个很有意思的专门为小企业做BI(Business Intelligence,商业智能,商业情报)分析报表的在线服务RJMetrics,很有意思的原因是它的专注,专门做数据分析和图表报告,客户群也很专注。在当前商业智能和竞争情报快速发展和转型的时期,对我们进一步开发和推广SliceProfile企业竞争情报系统很有借鉴价值。
前面大部分博文是关于怎样用MetaSeeker完成网站信息采集任务,本文推荐一篇文章,关于新闻调查公司ProPublica怎样DIY网站信息采集方案。
网站采集解决方案Mozenda的界面比较美观和精致,操作流程与免费采集器MetaSeeker基本一致,Mozenda Agent Builder相当于MetaSeeker的MetaStudio,Mozenda Agent Console相当于MetaSeeker的DataScraper。与MetaSeeker最大的不同在于:Mozenda的agents都运行在Mozenda的数据中心服务器上,所以采集结果也存在数据中心,可以通过下载或者邮件发送方式将数据拷贝到本地。
海外的iMacros for Firefox也是Firefox插件,这一点同国产的MetaSeeker一样,比较iMacros V6.6.5.0和MetaSeeker V4.11.0,发现诸多重合的功能特性,例如,Web信息提取功能。