我看微博博主主页已经改版了,新版改成了瀑布流,就是往下滚屏出现新的内容,采集的时候很容易出现往下滚不出新内容的情况。
请问下,怎样采集比较完整的采集新浪微博博主主页内容?我使用的是微博工具箱博主主页工具
QQ图片20230213092606.jpg
举报 使用道具
| 回复

共 1 个关于本帖的回复 最后回复于 2023-2-13 09:35

shenzhenwan10 金牌会员 发表于 2023-2-13 09:35:29 | 显示全部楼层
采集瀑布流页面的时候,网速好,计算机处理速度高,会爬的多一些。
上周上架了采集cn端博主主页的快捷采集:微博博主主页数据采集_cn端
QQ截图20230213093019.png
这个快捷采集采集的是cn域名的博主主页,支持翻页,采集的数据比较全。
添加网址的时候,注意要把博主主页的普通网址转换为cn结尾的网址,然后再添加。
举例来说,下面这个是普通的博主主页链接:
https://weibo.com/u/2803301701
转换成cn结尾的网址就是:
https://weibo.cn/2803301701
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-29 19:57