集搜客GooSeeker网络爬虫

标题: 新浪微博_评论采集 [打印本页]

作者: ym    时间: 2015-9-10 11:46
标题: 新浪微博_评论采集
我新发布了一个采集规则:
新浪微博_评论采集


详细信息:
采集热门博文的评论信息,用于分析微博效果、舆论走向、用户心理行为、舆情分析等,通过定时采集可实现持续监控的效果;微博采集需要登录账号,且要定期(1/2天)更换微博账号,降低封锁风险。 可与新浪微博_博主主页、新浪微博_博主详细信息、新浪微博_搜索列表、新浪微博_话题等规则资源结合使用,能够实现更加全面深入的分析研究。

希望大家喜欢!下载地址:
http://www.gooseeker.com/res/detail_91242.html
作者: yl_egov    时间: 2015-10-9 11:31
真心厉害!赞!
作者: yl_egov    时间: 2015-10-9 11:32
给力啊
作者: 瞌睡姑娘    时间: 2016-3-28 19:54
怎么设置自动翻页啊,只能抓到一页,比如抓微博账号为央视一带一路别报道的微博评论
作者: Fuller    时间: 2016-3-28 21:36
瞌睡姑娘 发表于 2016-3-28 19:54
怎么设置自动翻页啊,只能抓到一页,比如抓微博账号为央视一带一路别报道的微博评论 ...

发个网址我看看?

这个规则是有自动翻页的,下载下来以后不要修改,直接使用
作者: ym    时间: 2016-3-30 11:04
新浪微博转发的博文部分,网页结构发生改变,原有规则就会采集失败,现已更新了规则,大家可以重新下载继续使用
作者: ym    时间: 2016-3-30 11:05
新浪微博评论的博文部分,网页结构发生改变,原有规则就会采集失败,现已更新了规则,大家可以重新下载继续使用
作者: 亭子    时间: 2016-12-13 20:42
转发_博主名称 转发_博主id 转发_博主主页等这种内容怎么采集呢,在主页上既有转发的信息 也有原创的信息的前提下
作者: Fuller    时间: 2016-12-13 22:36
亭子 发表于 2016-12-13 20:42
转发_博主名称 转发_博主id 转发_博主主页等这种内容怎么采集呢,在主页上既有转发的信息 也有原创的信息的 ...

这个规则是采集评论的,直接用微博采集工具箱吧,你想要采集的内容应该都有,总共有6个采集工具。

作者: 亭子    时间: 2016-12-14 09:16
Fuller 发表于 2016-12-13 22:36
这个规则是采集评论的,直接用微博采集工具箱吧,你想要采集的内容应该都有,总共有6个采集工具。
...

但是我还需要计算热门转发数量,工具箱没有,那个区分是原创还是转发的有教程吗

作者: Fuller    时间: 2016-12-14 10:25
亭子 发表于 2016-12-14 09:16
但是我还需要计算热门转发数量,工具箱没有,那个区分是原创还是转发的有教程吗
...

在结果文件中,看每条微博,含有转发微博的就不是原创,可以按照这个原则来分拣

作者: 亭子    时间: 2016-12-14 14:10
Fuller 发表于 2016-12-14 10:25
在结果文件中,看每条微博,含有转发微博的就不是原创,可以按照这个原则来分拣
...

你说的这个知道啊。热门转发数目呢?要怎么分拣出来啊?你知道吗


作者: Fuller    时间: 2016-12-14 14:36
亭子 发表于 2016-12-14 14:10
你说的这个知道啊。热门转发数目呢?要怎么分拣出来啊?你知道吗

我不知道你说的“热门转发数目”是指什么?怎么才算热门?

作者: 亭子    时间: 2016-12-14 18:56
Fuller 发表于 2016-12-14 14:36
我不知道你说的“热门转发数目”是指什么?怎么才算热门?

打开转发页面,微博上有说以上为热门转发 应该是这样子的





欢迎光临 集搜客GooSeeker网络爬虫 (https://www.gooseeker.com/doc/) Powered by Discuz! X3.2