本帖最后由 18819822199 于 2022-4-19 15:21 编辑

我想抓取人民日报微博,主持和发起的话题,特定日期区间,怎样操作?求教!!我尝试使用主页数据以及热门话题工具几次都失败了,使用旧版已经登录。
举报 使用道具
| 回复

共 1 个关于本帖的回复 最后回复于 2022-4-19 16:54

沙发
Fuller 管理员 发表于 2022-4-19 16:54:02 | 只看该作者
还是要用微博主页采集工具:https://www.gooseeker.com/res/softdetail_3.html

选择采集全部历史数据的选项,采集下来以后,导出数据,在excel中筛选出来主持的话题。

采集微博主页本来是比较稳定的,比较容易全部采集下来,采集失败的可能原因是:
1. 在微博主页上设置的筛选条件太多了,筛选越多,约容易失败。如果什么条件都不筛选,得到一个最纯粹的网址,才容易采集到所有微博2. 网络速度要足够快
3. 爬虫运行的时候,要确保爬虫窗口放大到最大
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法
  • 利用AI阅读和分析文本:扣子COZE记录用户反
  • 在网页片段内直观标注——以B站评论采集为
  • 利用AI阅读和分析文本:使用COZE建设游记文

热门用户

GMT+8, 2024-12-23 04:21