知识库

什么是sentiment analysis(情感分析)?

Sentiment analysis(情感分析) or opinion mining(观点挖掘)的目的是判断作者或者演讲者对某个话题(topic)的态度(attitude),所述态度包括:

  • 判断
  • 评价
  • 情绪状况
  • 情绪交流等等

互联网进入Web2.0时代后,网络上大量涌现网友创作的内容(user-generated content),因此对这些内容进行情感分析或者观点挖掘具有巨大价值。下面的内容摘自维基百科

网页内容抓取在市场营销调研分析领域的地位走势

Next Gen Market Research刚刚发布了一个调查报告概要,关于当前和今后使用的市场营销调研分析技术,数据挖掘及其相关技术仍然是最主流技术,下面两图引自原文


当前按重要性从高到低排序

比较实体提取/识别(entity extraction)API

看到某网友对比了多个实体识别/提取API,很有参考价值,摘录如下:

网页抓取/网站内容采集与著作权/知识产权

网页抓取和网站内容采集是否会触犯著作权或其它知识产权相关的法律?这是一个很难讲清楚的问题,好像也没有明确的法律条文规定,当前的状态就像一个网友说的:

网页内容提取软件工具包MetaSeeker的使用技巧

本网页将不断汇总典型的网页抓取/数据抽取/信息提取软件工具包MetaSeeker的使用案例,本页内容随着时间推移不断扩充

个性化互联网和推荐引擎

推荐引擎并不是一个新概念,大型的电子商务网站(例如,Amazon)很多年前就采用了推荐引擎技术,但是从2008年开始,陆续看到很多采用推荐引擎技术的网站开始盈利,推荐引擎就更受关注了,最近又有谷歌个性化搜索服务被诉侵权的报道,涉案专利是2000年申请的,而个性化是推荐引擎的核心,由此可见,推荐引擎的历史很久远。本文对其历史进行回溯,将一些关键资料进行汇集,方便产品和市场战略研究。

MetaSeeker作为谓词编辑和标注工具为搜索引擎提供结构化语义数据

刚读了一篇博文Did Google Just Expose Semantic Data in Search Results?,博文的作者敏锐地发现在Google搜索结果中出现了主-谓-宾格式的搜索结果展现(参见原文的截图),是典型的语义网络技术特征,引起了很多技术领导者的猜想,最焦点的问题是:这种结构化数据是由Google采用某种语义分析技术从非结构化数据中分析出

分布式社交网互联技术、服务和讨论

随着社交网站像雨后春笋般涌现,分布式社交网互联(distributed social networking)技术和服务浮现出来,我感觉其吸引眼球的效用远远大于实际功用,作为一个网络服务的运营者,成功来自于网络外部性,而分布式的互联互通是一股削弱的力量。就像几年前热炒的即时通信的互联互通一样,行业的垄断者必然会抵制这场运动。然而,整个世界趋于平坦,任何一个行业和团体想逆转这个趋势只能是螳臂挡车。

Leader vs. Facebook --专利侵权

消息,位于俄亥俄州的科技公司Leader Technology周四向美国联邦地方法院对Facebook提起专利侵权诉讼,声称Facebook用于存储和管理信息的平台系该公司发明。

Leader Technology称,Facebook侵犯了美国专利和商标局2006年11月21日批准的专利权,并要求Facebook停止使用该项技术,并寻求一定的赔偿金。

Syndicate content