怎么吧一个微博博主的所有博文数据都抓取下来
举报 使用道具
| 回复

共 7 个关于本帖的回复 最后回复于 2021-3-9 12:03

来自 8#
wangyong 版主 发表于 2021-3-9 12:03:03 | 只看该作者
1,下载集搜客数据管家,从左侧工具条进入微博采集工具箱,选择微博博主主页采集工具

2,选择新建采集任务→全部历史微博→添加要采集的博主网址

3,添加完网址后,点击启动采集

4,待数据采集完成后,点击打包就可以下载Excel格式的数据了,如果需要数据api直接对接到数据库中,可以选择VIP版

举报 使用道具
沙发
shengchengx 金牌会员 发表于 2018-4-17 17:49:11 | 只看该作者
微博博主主页采集工具可以直接使用微博工具箱这个工具
如果博主博文过多的话,可以通过限制时间缩小采集的页数,每条线索控制在三十页左右


举报 使用道具
板凳
lznboy88 新手上路 发表于 2019-7-2 14:59:47 | 只看该作者
请问具体怎么操作,感觉爬的都是博文的一部分。
举报 使用道具
地板
wangyong 版主 发表于 2019-7-2 17:15:56 | 只看该作者
lznboy88 发表于 2019-7-2 14:59
请问具体怎么操作,感觉爬的都是博文的一部分。

新浪不允许一次性查看博主的所有微博,需要通过细分不同年月的链接来完成所有的爬取
例如这个链接,可以采集到雷军2019年6月份发布的所有微博
https://weibo.com/leijun?is_all=1&stat_date=201906#feedtop

举报 使用道具
5#
wangyong 版主 发表于 2019-7-2 17:16:27 | 只看该作者
wangyong 发表于 2019-7-2 17:15
新浪不允许一次性查看博主的所有微博,需要通过细分不同年月的链接来完成所有的爬取
例如这个链接,可 ...

可以通过微博工具的微博博主主页工具来爬取
https://www.gooseeker.com/res/softdetail_3.html
举报 使用道具
6#
lznboy88 新手上路 发表于 2019-7-3 22:45:38 | 只看该作者
wangyong 发表于 2019-7-2 17:15
新浪不允许一次性查看万博主的所有微博,需要通过细分不同年月的链接来完成所有的爬取
例如这个链接,可 ...

好的,请问一下,那个细分不同年月的细节是怎么操作的,我怎么找不到那个操作界面。。
举报 使用道具
7#
Fuller 管理员 发表于 2019-7-3 23:21:54 | 只看该作者

举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-19 12:35