1341#
Fuller 管理员 发表于 2022-4-15 15:03:25 | 只看该作者
阿拉活动开 发表于 2022-4-15 14:43
请问怎么爬取完整的微博内容呢?遇到展开的就爬不完整了

把需要展开的微博在excel中删选出来,把网址拷贝出来,导入这个快捷采集工具:https://www.gooseeker.com/res/rule_494.html
举报 使用道具
1342#
luomuxiaoxiao 初级会员 发表于 2022-4-15 17:43:38 | 只看该作者
请问微博博主详细资料采集工具,可以用excel导入网址吗?
举报 使用道具
1343#
Fuller 管理员 发表于 2022-4-15 19:16:45 | 只看该作者
luomuxiaoxiao 发表于 2022-4-15 17:43
请问微博博主详细资料采集工具,可以用excel导入网址吗?

不能导入excel,不过也不麻烦。在excel中,把所有网址行选中,拷贝,然后到微博采集工具箱的输入网址界面上,粘贴,就会把所有行都一次性拷贝进来
举报 使用道具
1344#
fanzeng123 初级会员 发表于 2022-4-23 18:08:28 | 只看该作者
为什么在结果中有些空白行?
举报 使用道具
1345#
Fuller 管理员 发表于 2022-4-24 09:33:23 | 只看该作者
fanzeng123 发表于 2022-4-23 18:08
为什么在结果中有些空白行?

要具体看哪个采集工具产生的结果。有空行会有多种原因。比如,网页上有些作为分界的内容,例如,10条信息之间就间隔一个分解,采集下来是空白的,可以把空白的从excel中过滤掉
举报 使用道具
1346#
fanzeng123 初级会员 发表于 2022-4-24 17:44:51 | 只看该作者
采集微博博主全部微博出现的空白行
举报 使用道具
1347#
Fuller 管理员 发表于 2022-4-24 18:10:26 | 只看该作者
fanzeng123 发表于 2022-4-24 17:44
采集微博博主全部微博出现的空白行

把你采集的微博博主网址发给我测试一下。

爬虫运行的时候,一定要把窗口放大到最大,不然,不会加载网页内容
举报 使用道具
1348#
fanzeng123 初级会员 发表于 2022-4-24 20:58:44 | 只看该作者
譬如这个https://weibo.com/adidastraining?profile_ftype=1&is_all=1#_0
举报 使用道具
1349#
fanzeng123 初级会员 发表于 2022-4-24 20:58:59 | 只看该作者
Fuller 发表于 2022-4-24 18:10
把你采集的微博博主网址发给我测试一下。

爬虫运行的时候,一定要把窗口放大到最大,不然,不会加载网页 ...

https://weibo.com/adidastraining?profile_ftype=1&is_all=1#_0
举报 使用道具
1350#
FoxJRly 新手上路 发表于 2022-4-24 23:31:02 | 只看该作者
请问现在有办法采集一个博主的全部粉丝吗?
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-1 05:41