也许Web 3.0真的在迫近,有的人说web 3.0就是语义网络,所以,议论语义网络的文章比比皆是,毫无疑问,大家都拿“语义”来说事,所以将语义网络炒得很神。我一直反对将语义网络神秘化,语义网络应该是Tim Berners Lee最早提出来的,最初的想法只是对现有Web的演进,他说有four rules,实际上我理解成三点:
也许Web 3.0真的在迫近,有的人说web 3.0就是语义网络,所以,议论语义网络的文章比比皆是,毫无疑问,大家都拿“语义”来说事,所以将语义网络炒得很神。我一直反对将语义网络神秘化,语义网络应该是Tim Berners Lee最早提出来的,最初的想法只是对现有Web的演进,他说有four rules,实际上我理解成三点:
2009年07月17日新浪消息谷歌个性化搜索服务被诉侵权报道,美国德克萨斯州Personalized User Model(以下简称“PUM”)周四在特拉华州一家地方法院起诉谷歌侵犯了其搜索引擎个性化技术专利。
很久没有上网搜集市场分析的材料了,这几个月一直在做一个实时对象搜索和管理引擎,在此期间看到多则对酷讯的分析,并没有引起多大关注,今天得闲,不知道什么触发,突然想看看赶集网的一些事情,也许其名字很亲切很有吸引力的原因。
阅读plain old xml considered harmful时发现了一个资料库关于posh。
最近读了Leigh Dodds的一篇文章Streams, Pools and Reservoirs,可谓长见识,Leigh Dodds认为语义搜索引擎(semantic search engine)和具有语义分析能力的搜索引擎(semantically enabled search engine)是两码事,得出这个结论的根据是对Web内容组织和检索的历史的回顾,类比曾经发生的Web的几个历史阶段,Leigh Dodds展望了基于linked data cloud的语义搜索引擎的特征,下面整理一下该文的要点及其思考<
今天读了一篇文章Now You Can Change What Google Says About You,学到了一个新词social graph search,大概可以翻译成社交网络搜索吧。
刚看到一则新浪新闻,百度阿拉丁平台上线了。从这个名提出来就开始关注,根据原来的宣传,该平台主要是用来索引Web上的暗信息,“阿拉丁”真是吊足了人的胃口,但是上了它的网站以后,左看右看,也没有什么特别的挖掘暗内容的手段。
MetaSeeker不仅仅是一个Web信息提取工具/信息抓取工具,它还是一个驻留在Web上的服务,采用一种协同方式由用户维护网页的信息结构。去年产品第一版发布后,一个用户在10月份问我:作为一个信息提取工具为什么要做成Web驻留的方式。
对人生的期许过于理想化不是一件好事,几年前为语义网络技术所吸引,深奥的理论研究已经做不了了,只想搞点实用的小东西。
在Web信息提取领域工作多年,经历了垂直搜索、社交网络、mashup、MEME、推荐引擎等多个浪潮,每个浪潮都需要大量的信息提取/页面抓取工具,经过多年的定制开发工作,发现这个领域简直是长青藤,要创办上述网站,需要消耗很大费用用于提取数据。