语义网络

结构化网页抓取工具Solvent

GooSeeker研发中心发布的MetaSeeker本身就是一款抓取网页内容并将其结构化存储的工具,GooSeeker网站有大量文档资料介绍MetaSeeker的原理,GooSeeker虽然也密切关注语义网络(Semantic Web)的发展动向,但是公开发布的MetaSeeker在线版更关注实用价值,相反国外的更多类似产品在网页内容结构化方面更进一步,本文介绍Solvent,它是语义网络项目Simile中的

主题搜索案例分析—Blekko

近半年一直为几个项目忙得团团转,其中商品和服务价格实时比价、企业竞争情报挖掘项目居多。从中可以看到商品比价应用领域和场合正在迁移,很多普通的比价网站虽然仍然在艰苦度日,比价技术的应用却方兴未艾;同时,作为MetaSeeker的开发团队,为MetaSeeker在这些领域的显著的竞争优势而自豪。

什么是启发式或探索法(heuristic)

名词解释

Heuristics,我喜欢的翻译是“探索法” ,而不是“启发式”,因为前者更亲民一些,容易被理解。另外,导致理解困难的一个原因是该词经常出现在一些本来就让人迷糊的专业领域语境中,例如,经常看到某某杀毒软件用启发式方法查毒,普通民众本来就对杀毒软件很敬畏,看到“启发式”就更摸不着北了。

实际上,这个词的解释十分简单,例如,查朗文词典,可以看到:

什么是Twitter注释

Twitter注释的新功能可以将任何元数据(metadata)附着于Twitter消息。目前,每条长度限制为140个字符的Twitter 消息里都可以填写任何内容,包括大量的信息、外部网站链接等。不过,Twitter计划借助元数据来使内容更加丰富。

基于结构化数据交换平台的电子政务系统案例研究

我们在使用语义网络技术公开发布电子政务信息MetaSeeker确保电子政务和服务型政府网站向语义网络时代跨越两篇文章讲解了面向语义网络时代的结构化数据技术方法在建设下一代电子政务系统中的应用前景,以及怎样使用网页信息提取系统将非结构化内容转换成结构化数据以建立电子政务信息交换平台,还举了Data.gov

语义网络产品竞争性分析

本文从分析Factual的产品特性入手,对比分析几个主要的语义网络产品的竞争状况。Factual的创始人Gil Elbaz是赫赫有名的Google AdSense技术核心的发明人,估计在将该技术卖给Google时收入了一大笔。

使用语义网络技术公开发布电子政务信息

每天,政府各部门都要向互联网发布大量信息和各种数据,建设透明政府和服务型政府需要有效的发布和共享信息的技术手段和平台,并且应该鼓励公众和商业团体使用和重用政府发布的信息,进行聚合、关联和整合,以便更有效地提供公共服务。

MetaSeeker确保电子政务和服务型政府网站向语义网络时代跨越

电子政务以及服务型政府网站已经建设了多个阶段,例如,第一阶段、网上发布政务信息;第二阶段、网上信息非实时交互,主要提供表格和邮件方式;第三阶段、网上办事服务,可以下载表格,进行简单的流程操作(参见谈“E告”与电子政务、政府门户网站建设的创新)。

观察语义搜索引擎的走向

采用网页抓取/数据抽取/异构数据对象搜索软件工具包MetaSeeker的搜索引擎SliceSearch建设的威客任务、招标项目、外包项目搜索引擎上线几个月了,用户点击量逐日上升。

个性化互联网和推荐引擎

推荐引擎并不是一个新概念,大型的电子商务网站(例如,Amazon)很多年前就采用了推荐引擎技术,但是从2008年开始,陆续看到很多采用推荐引擎技术的网站开始盈利,推荐引擎就更受关注了,最近又有谷歌个性化搜索服务被诉侵权的报道,涉案专利是2000年申请的,而个性化是推荐引擎的核心,由此可见,推荐引擎的历史很久远。本文对其历史进行回溯,将一些关键资料进行汇集,方便产品和市场战略研究。

Syndicate content