内容分析应用 金牌会员 发表于 2021-5-12 11:04:56 | 显示全部楼层
queeny 发表于 2021-5-12 10:47
我已经再次尝试了。还是数据0。

我看你当前的那个任务“8月”, 添加的博主主页网址是: https://weibo.com/niflyhigh?is_all=1&stat_date=201212, 点开后看不到博主主页内容 QQ截图20210512105946.png
举报 使用道具
Fuller 管理员 发表于 2021-5-12 11:05:08 | 显示全部楼层
queeny 发表于 2021-5-12 10:47
我已经再次尝试了。还是数据0。

你把采集的博主网址发给我测试一下吧。看样子是完全没有采集到内容
举报 使用道具
queeny 新手上路 发表于 2021-5-12 12:05:42 | 显示全部楼层
Fuller 发表于 2021-5-12 11:05
你把采集的博主网址发给我测试一下吧。看样子是完全没有采集到内容

https://weibo.com/niflyhigh?is_all=1&stat_date=201212

是这个
举报 使用道具
queeny 新手上路 发表于 2021-5-12 12:06:28 | 显示全部楼层
Fuller 发表于 2021-5-12 11:05
你把采集的博主网址发给我测试一下吧。看样子是完全没有采集到内容

我刚刚采集时设置的全部可见。看不成功重新设置了最近半年。
但是你采集的话,我重新设置了全部可见了。你试试
举报 使用道具
queeny 新手上路 发表于 2021-5-12 12:07:02 | 显示全部楼层
Fuller 发表于 2021-5-12 11:05
你把采集的博主网址发给我测试一下吧。看样子是完全没有采集到内容

我是想把他的微博全部采集一下。现在连一个月的都采集不下来。。。。
举报 使用道具
内容分析应用 金牌会员 发表于 2021-5-12 12:21:44 | 显示全部楼层
queeny 发表于 2021-5-12 12:07
我是想把他的微博全部采集一下。现在连一个月的都采集不下来。。。。

你添加的那个博主网址有问题,正确的应该是这个:https://weibo.com/niflyhigh?is_all=1
如果你想采集他的所有微博, 可以选择“全部历史微博”
我测试了下, 采集还在进行,已经有194条数据了
QQ截图20210512122108.png

举报 使用道具
queeny 新手上路 发表于 2021-5-12 12:26:16 | 显示全部楼层
内容分析应用 发表于 2021-5-12 12:21
你添加的那个博主网址有问题,正确的应该是这个:https://weibo.com/niflyhigh?is_all=1
如果你想采集他的 ...

是这样的,这个博主总共发博是4535条。所以我看了教程,有个按月的可以执行。
全部历史我看到有人说只能采集到前五页。所以我不打算试了半天采了个寂寞。
是不是采集时还不能关闭这个网页。所以全部采集对我来说这个界面放着占用我的屏幕。。。。

主要我这里想采集最需要的是最早12年13年发布的内容。所以我才从12年按月采集的。
你按月试过没?我给的链接就是按月给的。 image.png
image.png
https://weibo.com/niflyhigh?is_all=1&stat_date=201212#feedtop


举报 使用道具
内容分析应用 金牌会员 发表于 2021-5-12 12:29:08 | 显示全部楼层
采集时, 你把爬虫软件的窗口最大化, 不要最小化或者关闭, 这样就采集不到了
这时候点击其它的软件窗口, 其它软件的窗口盖住了爬虫软件窗口是没关系的
爬取过程中电脑也可以继续使用
举报 使用道具
内容分析应用 金牌会员 发表于 2021-5-12 12:30:50 | 显示全部楼层
QQ截图20210512122944.png
上图中, 我的采集还在继续, 已经采集到了579条微博数据
举报 使用道具
内容分析应用 金牌会员 发表于 2021-5-12 12:34:10 | 显示全部楼层
选择全部历史微博, 就会自动按月采集, 不用添加每个月的网址

举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-29 16:37