信息提取

抓取雪球网股票信息

样本页面:http://xueqiu.com/S/SH601318

主题名:demo_fuller_xueqiu_list

雪球网的这个网页跟微博网站的网页很像,假设我们要抓取网友发表的关于中国平安的股票消息,跟抓取微博消息一样。而且,这个网站采用的动态网页技术也跟微博类似。这类动态网页的内容不断自动变化,如果在MetaStudio定义抓取规则过程中发生了变化,会有严重影响。

主题识别可能会遇到的问题

MetaStudio在层级抓取方面提供了一些便利方法。层级抓取是网络爬虫从深度方面扩展爬行范围的手段,比如,先抓取新闻网站的新闻列表,主要目的是得到每条新闻的网址,然后深入下去抓取每条新闻的详细内容。深入抓取的层次数量可以无限多,用户需要用MetaStudio给每一层定义抓取规则。

怎样展开抓取一淘上的商家

一淘网上有商品汇聚网页,比如EDIFIER/漫步者 C2音箱网页,上部是商品基本信息和价格走势,下部罗列销售这个商品的商家和网站。如果商品比较热门,卖家很多,这个网页一开始只显示一部分卖家,其他的都折叠隐藏起来,只有点击了“展开其他xxx件商品”后,才会显示出来。

阿里巴巴公司搜索结果抓取方法

阿里巴巴和慧聪网分类展示众多企业和公司及其产品信息,对这些信息进行发掘,可有效地用于商业活动中。比如,发现潜在客户进行精准营销。但是,阿里巴巴网站对访问公司搜索结果网页进行了限制,利用程序代码,比如用Javascript编写的程序,可以对用户访问行为进行判断,如果发现是网络爬虫在访问这些页面,则要求输入验证码。

微博运营思维导图


上图转自SocialBeta网,因为文字较小,便于阅读,将图的文字内容整理如下。


为了有效运营企业微博,应该思考如下问题

微博营销的流派

微博营销给人一种引爆的感觉,一方面,微博本身的发展像一个引爆过程;另一方面,微博用户寄希望于微博引爆自己的营销传播。我们在《观察微博营销》一文主要讲解了微博营销的方法和好处。本文引领读者冷静思考微博营销。“狂热过后,微博营销正走下神坛。

观察微博营销

虽然本职工作是为微博营销者提供微博监测和分析工具,但是,为了能够更好理解和服务客户,必须对微博营销进行观察和学习,本文是阅读《新浪微博营销方法》时作的读书笔记。

微博的特征

微博与传统传播模式的区别

观察现金返利网站

今天(2012年8月10日)阅读新浪文章《鲁振旺:现金返利网站已到穷途末路》。在过去的4年中,因为在持续监测电商的竞争要素和实时比价,其实与返利网站及其创办人有些技术服务方面的交流,看到这个标题,对返利网站行业感到惋惜,互联网上一波波浪潮过后,骚动成份被洗刷干净了,但也或多或少对行业造成一些损害。

读图:基于微博的社会化商业体系

围绕微博平台,一个完整的商业生态环境逐渐建立起来,对该环境的商业予以研究和分类,就可定义一个商业体系,下图摘自[1]

该图将围绕微博的商业活动聚合成以下7类,每类都分成3个层次:

体验购物搜索比价一找网

关于购物搜索一找网的新闻

根据和讯科技新闻《一找网的“火中取栗”秘诀》,据称一找网很好地解决了商品的精准聚类问题,提升了用户体验,而且还与一淘网进行对比,原文引述如下:

Syndicate content