信息提取

为什么使用信息提取工具提取航运网站信息

Wed, 04/22/2009 - 17:54 — Fuller

读了一则新闻Easyjet takes legal action against screen scraping，是因为非授权的信息提取（screen scraping）引起的纠纷，这两年已经看到多起了，而且都是在航运领域，但是，一直没有想明白，为什么会这么集中到这个领域？

Wed, 04/22/2009 - 09:37 — Fuller

MetaSeeker不仅仅是一个Web信息提取工具/信息抓取工具，它还是一个驻留在Web上的服务，采用一种协同方式由用户维护网页的信息结构。去年产品第一版发布后，一个用户在10月份问我：作为一个信息提取工具为什么要做成Web驻留的方式。

Thu, 04/16/2009 - 15:40 — Fuller

对人生的期许过于理想化不是一件好事，几年前为语义网络技术所吸引，深奥的理论研究已经做不了了，只想搞点实用的小东西。

Wed, 04/15/2009 - 21:49 — Fuller

在Web信息提取领域工作多年，经历了垂直搜索、社交网络、mashup、MEME、推荐引擎等多个浪潮，每个浪潮都需要大量的信息提取/页面抓取工具，经过多年的定制开发工作，发现这个领域简直是长青藤，要创办上述网站，需要消耗很大费用用于提取数据。

Wed, 04/08/2009 - 19:13 — Fuller

MetaSeeker V3.1.0已经发布了，相对于V2版本，改动相当大，耗费的资金和时间远远超出预期，随着越来越多用户下载使用，规划下一版本的时候到了。