发布者发布内容是可以采集的,但是转发量,评论两,点赞数操作始终有问题,求高手指点。
举报 使用道具
| 回复

共 10 个关于本帖的回复 最后回复于 2020-10-12 15:05

来自 10#
wangyong 版主 发表于 2020-10-12 14:43:19 | 只看该作者
微博转发评论的数据采集可以直接用集搜客微博工具箱中的微博评论转发采集工具



举报 使用道具
来自 11#
Fuller 管理员 发表于 2020-10-12 15:05:10 | 只看该作者
wangyong 发表于 2020-10-12 14:43
微博转发评论的数据采集可以直接用集搜客微博工具箱中的微博评论转发采集工具

是的,应该直接使用集搜客微博采集工具箱中的工具,不用自己定义规则,因为微博网页上抓取内容比较多,规则比较复杂,把一个规则调试好比较花时间。集搜客微博采集工具箱就是为了给大家免去这些麻烦,直接输入网址或者搜索关键词就能使用。毕业设计写论文需要做内容分析的话,很适合用这套工具箱。
举报 使用道具
沙发
HJLing 版主 发表于 2017-1-17 14:33:34 | 只看该作者
微博的转发评论点赞数需要选择绝对定位 不然会全都采到转发数

集搜客有现成的微博采集工具 不用自己动手做规则 微博采集工具箱
举报 使用道具
板凳
Wang_GooSeeker 高级会员 发表于 2018-4-25 12:36:28 | 只看该作者
HJLing 发表于 2017-1-17 14:33
微博的转发评论点赞数需要选择绝对定位 不然会全都采到转发数

集搜客有现成的微博采集工具 不用自己动手做 ...

我用的“微博关键词搜索结果采集”,发现转发和评论的数量采不到。
比如一条澎湃新闻的微博,微博网页上显示转发是41433次,评论81949条,但是采集结果都是0。点赞数有,存在个位数的差别,可以忽略。
所以怎么调整保证转发和评论数量的抓取正确?
举报 使用道具
地板
Fuller 管理员 发表于 2018-4-25 12:59:44 | 只看该作者
Wang_GooSeeker 发表于 2018-4-25 12:36
我用的“微博关键词搜索结果采集”,发现转发和评论的数量采不到。
比如一条澎湃新闻的微博,微博网页上 ...

你用的是微博工具箱里的关键词工具?刚测了下,可以抓到转发和评论数呀,你搜哪个关键词,我们测一下
举报 使用道具
5#
Wang_GooSeeker 高级会员 发表于 2018-4-25 13:17:11 | 只看该作者
Fuller 发表于 2018-4-25 12:59
你用的是微博工具箱里的关键词工具?刚测了下,可以抓到转发和评论数呀,你搜哪个关键词,我们测一下
...

是的,设置的“江歌案”2017年12月11日03时 - 2017年12月11日05时。
其中有一条澎湃新闻在2017-12-11 05:59的微博很明显只采到了点赞数,没有采集转发数和评论数。
举报 使用道具
6#
Wang_GooSeeker 高级会员 发表于 2018-4-25 13:47:51 | 只看该作者
Fuller 发表于 2018-4-25 12:59
你用的是微博工具箱里的关键词工具?刚测了下,可以抓到转发和评论数呀,你搜哪个关键词,我们测一下
...

我又试了下别的关键词,“fresh红茶”,确实采不到转发和评论数量。
举报 使用道具
7#
Fuller 管理员 发表于 2018-4-25 14:01:52 | 只看该作者
Wang_GooSeeker 发表于 2018-4-25 13:47
我又试了下别的关键词,“fresh红茶”,确实采不到转发和评论数量。

我刚测了下,是可以采到的,是不是跟你的网络状况有关?网络是不是比较慢?网页加载的比较慢?


另外,很多以前的微博,不会显示转发和评论数,你可以手工打开看看。

举报 使用道具
8#
Fuller 管理员 发表于 2018-4-25 14:09:57 | 只看该作者
Wang_GooSeeker 发表于 2018-4-25 13:47
我又试了下别的关键词,“fresh红茶”,确实采不到转发和评论数量。

把积分返还给你了,换个网络,再试试
举报 使用道具
9#
Wang_GooSeeker 高级会员 发表于 2018-4-25 14:15:09 | 只看该作者
Fuller 发表于 2018-4-25 14:09
把积分返还给你了,换个网络,再试试

这样啊,那我再试试。谢谢、
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-24 16:52