为什么一个微博评论抓取不全,比如评论有7000多条,已经多次爬取得到三百多条评论,应该不是网速问题,爬着爬着跳转到博主主页的照片墙。
举报 使用道具
| 回复

共 2 个关于本帖的回复 最后回复于 2021-7-3 14:01

沙发
Fuller 管理员 发表于 2021-7-3 09:34:51 | 只看该作者
微博评论很难抓取全的。手工滚动鼠标往下看就会知道,很容易遇到“没有更多评论了”,其实评论数很大很大。经过长期观察,发现,如果抓取评论或者转发,某一屏有过多删帖,甚至整屏都被屏蔽了,到那一屏基本上就会中断了。

再就是微博网站不稳定导致的,那么就要多采集几遍,取采到数量最多的那一次
举报 使用道具
板凳
13751501299 初级会员 发表于 2021-7-3 14:01:08 | 只看该作者
Fuller 发表于 2021-7-3 09:34
微博评论很难抓取全的。手工滚动鼠标往下看就会知道,很容易遇到“没有更多评论了”,其实评论数很大很大。 ...

好的,谢谢
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-27 13:04