规则介绍
本规则采集热门博文的评论信息,可以批量采集不同博文的评论数据,只需把博文的独立网址导入到规则即可【点击博文的发布时间就能进入到博文独立网址】,具体使用方法请参考教程http://www.gooseeker.com/doc/article-85-1.html ,【注意:由于微博评论增加了瀑布流结构,所以,DS打数机要设置高级菜单->终点标志->勾上重复内容,再运行采集。】
微博采集需要登录账号,且要定期(1/2天)更换微博账号,降低封锁风险。
可与新浪微博_博主主页、新浪微博_博主详细信息、新浪微博_搜索列表、新浪微博_话题、新浪微博_转发等规则资源结合使用,能够实现更加全面深入的分析研究。
若你想免除做规则的时间,可使用微博评论和转发采集工具直接获取数据。
注:请先登录所抓取的网站,再运行该规则。
(如果该规则与描述不符或无效,您可
申诉。)
样本页面
采集内容
信息字段 | 网页内容 |
---|---|
列表 | |
评论 | 采集微博下的评论列表 |
com博主头像 | 评论者微博头像网址 |
com博主id | 评论者的微博id |
com博主名称 | 评论者的微博名称 |
com博主主页 | 评论者的微博主页网址 |
com评论内容 | 评论内容 |
com发布时间 | 发布时间 |
com回复数 | 回复数量 |
com点赞数 | 点赞数 |
博文 | 原博文信息 |
au博主 | 博主名称 |
au博主id | 博主id |
au博文内容 | 博文内容 |
au发布时间 | 发布时间 |
au发布终端 | 发布终端 |
au转发数 | 转发数 |
au评论数 | 评论数 |
au点赞数 | 点赞数 |
转发_博主名称 | 转发_博主名称 |
转发_博主id | 转发_博主id |
转发_博主主页 | 转发_博主主页 |
转发_博文内容 | 转发_博文内容 |
转发_发布时间 | 转发_发布时间 |
转发_发布终端 | 转发_发布终端 |
转发_转发数 | 转发_转发数 |
转发_评论数 | 转发_评论数 |
转发_点赞数 | 转发_点赞数 |
数据截图

用户评论

-
maomao 2023-03-23 20:06
微博网站能够浏览的评论可能只是部分,比如虽然看到评论数上万,可是能够实际浏览的可能不到千条; 而且,weibo评论是瀑布流,不是翻页,很难说能采集多少。 要想尽量采集的多,有以下建议: 1.爬微博之前,一定要在集搜客浏览器登陆微博 2.网速要好,网速好,才能及时加载网页,把评论加载出来 3.计算机处理速度要快,这样才能及时把评论网页加载出来 4.采集量大了,要及时清缓存
关于作者
作者其他资源更多 >
- 学校列表-findingschool网站
- findingschool网站的院校点评列表,教育行业信息,国外学校最新资讯,留学必备参考。可以与规则“学校详情-findingschool网站”一起使用,这样就可以把采到的网址生成第二级“学校详情-findingschool网站”的线索,用第二级规则就可以抓取到更多详细信息。
- 学校详情-findingschool网站
- findingschool网站的国外各大院校的详情信息,教育行业信息,国外学校最新资讯,留学参考必备,可以深入分析了解国外学校收费资讯、教育资质、硬件设施等
- 新浪微博_博主主页
- 本规则采集博主主页的博文信息,可以批量采集微博网址的数据,只需把同类网址导入到规则即可,具体使用方法请参考教程 http://www.gooseeker.com/doc/article-85-1.html 。
【注意:采集前要设置DS打数机的配置菜单->滚屏参数,滚屏次数为15或以上,滚屏速度为2,具体参数含义请看滚屏设置 http://www.gooseeker.com/doc/article-57-21.html 】。
【微博采集需要登录账号,且要定期(1或2天)更换微博账号,降低封锁风险】。
可与新浪微博_博主详细信息、新浪微博_搜索列表、新浪微博_评论、新浪微博_话题等规则资源结合使用,能够实现更加全面深入的分析研究。
若你想免除做规则的时间,可使用微博博主主页采集工具直接获取数据。