微博改版了,博文转发页面变成瀑布流了,很难把博文所有的转发采集下来。有解决方法吗?
比如,这条博文的转发
https://weibo.com/2168922075/KAJkJ1Wrc#repost

举报 使用道具
| 回复

共 3 个关于本帖的回复 最后回复于 2023-3-5 22:36

沙发
Fuller 管理员 发表于 2023-3-5 22:21:29 | 只看该作者
微博的cn端,博文的转发页面是翻页的,可以采集全部的转发内容。
比如,你要采集的博文转发链接 https://weibo.com/2168922075/KAJkJ1Wrc#repost
在微博cn端,这条博文的转发链接是https://weibo.cn/repost/KAJkJ1Wrc?uid=2168922075
把这条链接添加到微博转发采集_cn端快捷工具,页数选择全部。就可以采集到全部的转发内容。



举报 使用道具
板凳
Fuller 管理员 发表于 2023-3-5 22:25:51 | 只看该作者
观察这两个链接,就知道了如何构造cn端的博文转发链接
https://weibo.com/2168922075/KAJkJ1Wrc#repost

https://weibo.cn/repost/KAJkJ1Wrc?uid=2168922075
举报 使用道具
地板
Fuller 管理员 发表于 2023-3-5 22:36:23 | 只看该作者
而且,在微博cn端,博文转发的每一页都有单独网址,比如上述网页的825页的链接是https://weibo.cn/repost/KAJkJ1Wrc?uid=2168922075&page=825,如果采集的时候在这一页断掉,那可以把825页的链接添加到微博转发采集_cn端快捷工具,继续采集。
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 苹果mac电脑安装集搜客网络爬虫软件失败的
  • 下载支持win7的集搜客网络爬虫软件
  • 遇到“无法识别的应用”告警怎么办?
  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词

热门用户

GMT+8, 2024-7-27 16:57