GooSeeker集搜客网络爬虫,简单高效的网页采集器

新浪微博_评论

2412 110 40 所需积分:2000 更新时间:2015-08-13 14:11 类别: 社交网络

规则介绍

本规则采集热门博文的评论信息,可以批量采集不同博文的评论数据,只需把博文的独立网址导入到规则即可【点击博文的发布时间就能进入到博文独立网址】,具体使用方法请参考教程http://www.gooseeker.com/doc/article-85-1.html ,【注意:由于微博评论增加了瀑布流结构,所以,DS打数机要设置高级菜单->终点标志->勾上重复内容,再运行采集。】 微博采集需要登录账号,且要定期(1/2天)更换微博账号,降低封锁风险。 可与新浪微博_博主主页、新浪微博_博主详细信息、新浪微博_搜索列表、新浪微博_话题、新浪微博_转发等规则资源结合使用,能够实现更加全面深入的分析研究。
若你想免除做规则的时间,可使用微博评论和转发采集工具直接获取数据。

注:请先登录所抓取的网站,再运行该规则。 (如果该规则与描述不符或无效,您可 申诉。)

采集内容

信息字段 网页内容
列表
评论 采集微博下的评论列表
com博主头像 评论者微博头像网址
com博主id 评论者的微博id
com博主名称 评论者的微博名称
com博主主页 评论者的微博主页网址
com评论内容 评论内容
com发布时间 发布时间
com回复数 回复数量
com点赞数 点赞数
博文 原博文信息
au博主 博主名称
au博主id 博主id
au博文内容 博文内容
au发布时间 发布时间
au发布终端 发布终端
au转发数 转发数
au评论数 评论数
au点赞数 点赞数
转发_博主名称 转发_博主名称
转发_博主id 转发_博主id
转发_博主主页 转发_博主主页
转发_博文内容 转发_博文内容
转发_发布时间 转发_发布时间
转发_发布终端 转发_发布终端
转发_转发数 转发_转发数
转发_评论数 转发_评论数
转发_点赞数 转发_点赞数

数据截图

用户评论

 1. 旅行的意义 2015-08-14 13:36

  这个规则采集的信息真全,懒得自己做了,下载一个用用

 2. gz51837844_5 2015-08-14 15:20

  这个属性真多

 3. gz51837844_5 2015-08-14 15:24

  下载试试

 4. 矿工的风采 2015-08-14 17:24

  这个资源好用!有个问题,就是如果某篇热门博文有200多页的评论时,好像微博经常翻不完整,为什么?

 5. 华为EMUI 2015-08-14 17:36

  "矿工的风采 2015-08-14 17:24 这个资源好用!有个问题,就是如果某篇热门博文有200多页的评论时,好像微博经常翻不完整,为什么?" To 矿工的风采: 对于比较热门的微博,其评论一般会在发布后快速增长,而微博服务器一般会设计有反抓取机制,以防这些评论被用户下载到本地,任何爬虫软件都会遇到同样的问题,只就只能通过我们采集GooSeeker爬虫软件的定时自启动功能进行循环抓取评论数据的前50页,通过设定间隔一定时间如1小时就启动一次爬虫进行抓取,最后把全部抓取到的评论在数据库进行程序自动去重处理。

关于作者

作者其他资源更多 >

当当网商品评论
这个规则采集的是当当网商品评论的独立网址,与规则“当当网采集品类子选项的商品列表”组合使用,可以获得某分类下的所有商品的评论网址,并进行全方位的追踪分析,用于研究消费者的购买行为和产品优化。这个规则也可单独使用,但需人工构造出商品评论的独立网址,详情可点击样本网址参考。 规则可以采集批量网址的数据,只需把同类网址导入到规则即可,具体使用方法请参考教程http://www.gooseeker.com/doc/article-85-1.html
当当网商品评论
这个规则采集的是当当网商品评论的独立网址,与规则“当当网采集品类子选项的商品列表”组合使用,可以获得某分类下的所有商品的评论网址,并进行全方位的追踪分析,用于研究消费者的购买行为和产品优化。这个规则也可单独使用,但需人工构造出商品评论的独立网址,详情可点击样本网址参考。 规则可以采集批量网址的数据,只需把同类网址导入到规则即可,具体使用方法请参考教程http://www.gooseeker.com/doc/article-85-1.html
当当网商品详情
采集当当网上商品的详细信息,可用于监控产品的价格变动、下架、促销活动、竞争分析、营销分析等。与规则“当当网采集品类子选项的商品列表”组合使用,能对某分类下的所有商品进行全方位的追踪分析。 规则可以采集批量网址的数据,只需把同类网址导入到规则即可,具体使用方法请参考教程http://www.gooseeker.com/doc/article-85-1.html
V8.9 版权所有 © 2007-2016 GooSeeker 深圳市天据电子商务有限公司
粤ICP备11065265号-2 粤公网安备 44030502000239号