是否能够实现实时在线的网络内容格式的转换

我记得有人提出过transcoder的概念,就是实时地将用户浏览的页面转换成其它格式,例如,适合手机浏览。能否使用网页抓取/数据抽取/信息提取软件工具包MetaSeeker实现这个功能?

MetaSeeker工具包可以做在线实时网站内容格式转换

网页抓取/数据抽取/信息提取软件工具包MetaSeeker可以实现这个需求,或者仅仅使用MetaSeeker产生的语义结构,自己写一个嵌入式的在线实时转换程序。这些都是理论上的探讨,实际,不一定划算,也许需要检验一下才行。根据我做电信设备的经验,这种实时的格式转换,要有好的用户体验,必须要有足够的“信道”,这 个代价是很高的,另外也许会有copyright的问题,我认为这是再发布过程。但是,如果将这种transcoder做在客户端,也许可行,做成一个浏 览器插件或者扩展,就不叫transcoder了,就是一个终端应用,用户自己选择安装,应该能够避过copyright问题,但是,要实现一个基础,就 是该应用能够识别内容的语义结构,才能进行适当的转换。

网页抓取/数据抽取/信息提取软件工具包MetaSeeker不仅仅是网络爬虫工具,还是一个协作式语义结构共建工具,与MetaCamp服务器配合,采用免费的SAAS运营方式,所有用户都能够定义和共享语义结构,需要做transcoder类转换的应用程序都可以通过MetaCamp提供的API获得语义结构对数据进行处理。MetaSeeker工具包中的工具软件DataScraper是一个定题(聚焦)爬虫,也是使用这些语义结构,从目标页面上抽取数据并转换成XML格式。这类应用不应该局限于数据抽取,有很大的想象空间,例如,某个页面上有商务联络信息,而且该页面的语义结构已经定义,那么具有语义结构识别能力的应用程序可以直接将这些联系方法存储到用户的“联系人”数据库中。