Fuller's blog

观察语义搜索引擎的走向

采用网页抓取/数据抽取/异构数据对象搜索软件工具包MetaSeeker的搜索引擎SliceSearch建设的威客任务、招标项目、外包项目搜索引擎上线几个月了,用户点击量逐日上升。

在线个人资产和金融管理集成服务的新闻事件

今天的热点新闻应该是关于Intuit To Acquire (Former TechCrunch50 Winner) Mint For $170 Million

Mint成立才两年,以$140M出售给Intuit,所以很惹人注目和艳羡,愤怒的声音如The next generation bends over,开篇第一句:

网页内容提取软件工具MetaSeeker用于产品定价和竞争指数计算(competitor indexing)

竞争指数计算(competitor indexing)是市场营销人员用于产品定价的技巧,是营销组合(marketing mix)中的4P之一(中文解释可以参见营销组合和4P)。可见竞争指数计算既有悠久的历史,又是市场营销广泛使用的技巧。

网页内容提取软件工具包MetaSeeker的使用技巧

本网页将不断汇总典型的网页抓取/数据抽取/信息提取软件工具包MetaSeeker的使用案例,本页内容随着时间推移不断扩充

为网络营销采集email地址

在互联网(web)上,email营销是一个很有效的手段,在国外媒体上email营销和RSS营销排在网络营销的前两位,主要是因为两者有很强的送达效能,使用电子邮件可以进行各种各样的在线的营销推广活动,例如:

个性化互联网和推荐引擎

推荐引擎并不是一个新概念,大型的电子商务网站(例如,Amazon)很多年前就采用了推荐引擎技术,但是从2008年开始,陆续看到很多采用推荐引擎技术的网站开始盈利,推荐引擎就更受关注了,最近又有谷歌个性化搜索服务被诉侵权的报道,涉案专利是2000年申请的,而个性化是推荐引擎的核心,由此可见,推荐引擎的历史很久远。本文对其历史进行回溯,将一些关键资料进行汇集,方便产品和市场战略研究。

使用Java实现的网页内容抓取和数据抽取工具

  • 简洁轻便的Java浏览器HtmlUnit 2.6发布介绍了HtmlUnit,这是一个用Java编写的网站测试工具,是一个开源项目,网站测试工具一般通过模拟用户的点击网页的行为测试某个网站的所有网页是否正确、是否可访问等,因此同样的工具可以用于执行网站信息提取和网页数据抽取任务,而且网站测试工具一般能够很好的解析Javascript代码,所以很适合采集A

使用Ruby实现网页抓取和数据抽取

使用Javascript实现网页抓取和数据抽取

搜索引擎优化(SEO)

有自己的网站的人都关注搜索引擎优化(SEO),都想让自己的网站有最好的曝光率,搜索引擎优化专家能够给予很好的指导,而且在一些博客和论坛上,搜索引擎优化专家的文章也很受欢迎,每次浏览博客文章,我都会特意阅读新的相关文章,阅读的多了,发现不同专家的观点可能存在不一致。

Syndicate content