Blogs

什么是语义搜索引擎

最近读了Leigh Dodds的一篇文章Streams, Pools and Reservoirs,可谓长见识,Leigh Dodds认为语义搜索引擎(semantic search engine)和具有语义分析能力的搜索引擎(semantically enabled search engine)是两码事,得出这个结论的根据是对Web内容组织和检索的历史的回顾,类比曾经发生的Web的几个历史阶段,Leigh Dodds展望了基于linked data cloud的语义搜索引擎的特征,下面整理一下该文的要点及其思考<

学习social graph search

今天读了一篇文章Now You Can Change What Google Says About You,学到了一个新词social graph search,大概可以翻译成社交网络搜索吧。

百度阿拉丁平台有什么用?

刚看到一则新浪新闻百度阿拉丁平台上线了。从这个名提出来就开始关注,根据原来的宣传,该平台主要是用来索引Web上的暗信息,“阿拉丁”真是吊足了人的胃口,但是上了它的网站以后,左看右看,也没有什么特别的挖掘暗内容的手段。

为什么使用信息提取工具提取航运网站信息

读了一则新闻Easyjet takes legal action against screen scraping,是因为非授权的信息提取(screen scraping)引起的纠纷,这两年已经看到多起了,而且都是在航运领域,但是,一直没有想明白,为什么会这么集中到这个领域?

MetaSeeker积累的元数据能做什么

MetaSeeker不仅仅是一个Web信息提取工具/信息抓取工具,它还是一个驻留在Web上的服务,采用一种协同方式由用户维护网页的信息结构。去年产品第一版发布后,一个用户在10月份问我:作为一个信息提取工具为什么要做成Web驻留的方式。

能为语义网络技术做点什么

对人生的期许过于理想化不是一件好事,几年前为语义网络技术所吸引,深奥的理论研究已经做不了了,只想搞点实用的小东西。

为什么实现基于FreeFormat技术的Web信息提取

在Web信息提取领域工作多年,经历了垂直搜索、社交网络、mashupMEME推荐引擎等多个浪潮,每个浪潮都需要大量的信息提取/页面抓取工具,经过多年的定制开发工作,发现这个领域简直是长青藤,要创办上述网站,需要消耗很大费用用于提取数据。

推荐引擎和移动推荐引擎应该有好的发展前景

最近连续看到国外媒体报道推荐引擎盈利的消息,很受鼓舞。关于推荐引擎,早在2006年发表的文章美国手机业界看好“移动检索”,有这样一句话:

要想将检索结果的数量减少到用户真正需要的7项,必须使用性能强大的推荐引擎等至今还没有的技术。此类技术若能实现,或许还会影响到电脑检索技术

MetaSeeker客户端工具下一版本要实现的内容

MetaSeeker V3.1.0已经发布了,相对于V2版本,改动相当大,耗费的资金和时间远远超出预期,随着越来越多用户下载使用,规划下一版本的时候到了。

MetaSeeker作为谓词编辑和标注工具为搜索引擎提供结构化语义数据

刚读了一篇博文Did Google Just Expose Semantic Data in Search Results?,博文的作者敏锐地发现在Google搜索结果中出现了主-谓-宾格式的搜索结果展现(参见原文的截图),是典型的语义网络技术特征,引起了很多技术领导者的猜想,最焦点的问题是:这种结构化数据是由Google采用某种语义分析技术从非结构化数据中分析出

Syndicate content