语义网络

从语义网络向结构化数据回归

RWW最新文章Top 5 Web Trends of 2009: Structured Data将结构化数据(structured data)放在最前面讨论,虽然没有排序的意味,但是至少说明当人们思考新技术潮流时结构化数据首先出现在头脑中。

我在一系列文章中讨论了结构化数据(structured data)和结构化数据互联(linked data)及其与语义网络(semantic web)的关系,例如:

实时互联网(real-time web)是一种新的通信方式

Twitter的流行推动了实时互联网(real-time web)浪潮,实时互联网到底是什么,文章The Real-Time Web: A Primer从多个方面剖析了实时互联网的意义。下面针对针对作者提出的“实时互联网是一种新的通信方式”进行思考和研究。

对垂直搜索的展望

准确的说不是本人的展望,是读The Future of Vertical Search Engines的感想。

360度混搭(mashup)服务

因为混搭是网页抓取/数据抽取/信息提取软件工具包MetaSeeker的服务对象,所以,对混搭(mashup)一直比较关注,看到过各种引人注目的混搭,今天看到一个所谓的“360度混搭”,真是青出于蓝。

几个语义网络和语义搜索产品

什么是语义搜索引擎一文是2009年4月的一篇文章的读后感,笔者认为这是语义网络技术向linked data思想的回归,那么采取自然语言处理和人工智能路线的产品和服务发展的怎样了?今天阅读到一篇新文章HealthBase Is The Ultimate M

为什么开发MetaSeeker工具包

开发MetaSeeker工具包的动机归因于对语义网络时代的憧憬,语义网络发轫于互联网之父提出了linked data的想法,通俗一点说,在语义网络中的内容是结构化数据,而不是现在的自由文本,只有结构化的数据才能实现计算机程序之间的信息交换,计算机程序也能很容易的自动处理结构化内容。在这种产业发展形式下,网络爬虫技术被赋予了新使命。

再次思考什么是语义网络

也许Web 3.0真的在迫近,有的人说web 3.0就是语义网络,所以,议论语义网络的文章比比皆是,毫无疑问,大家都拿“语义”来说事,所以将语义网络炒得很神。我一直反对将语义网络神秘化,语义网络应该是Tim Berners Lee最早提出来的,最初的想法只是对现有Web的演进,他说有four rules,实际上我理解成三点:

什么是POSH

阅读plain old xml considered harmful时发现了一个资料库关于posh

什么是语义搜索引擎

最近读了Leigh Dodds的一篇文章Streams, Pools and Reservoirs,可谓长见识,Leigh Dodds认为语义搜索引擎(semantic search engine)和具有语义分析能力的搜索引擎(semantically enabled search engine)是两码事,得出这个结论的根据是对Web内容组织和检索的历史的回顾,类比曾经发生的Web的几个历史阶段,Leigh Dodds展望了基于linked data cloud的语义搜索引擎的特征,下面整理一下该文的要点及其思考<

学习social graph search

今天读了一篇文章Now You Can Change What Google Says About You,学到了一个新词social graph search,大概可以翻译成社交网络搜索吧。

Syndicate content