我想采集喜马拉雅上的作品数据和作品评论数据,该怎么操作呢?
QQ截图20211029173734.png
QQ截图20211029173754.png

举报 使用道具
| 回复

共 2 个关于本帖的回复 最后回复于 2021-10-29 18:57

wangyong 版主 发表于 2021-10-29 18:57:29 | 显示全部楼层
集搜客快捷采集可以输入链接直接采集喜马拉雅的数据,快捷采集上有全套的喜马拉雅采集入口,分别是:喜马拉雅搜索列表_声音
喜马拉雅搜索列表_专辑
喜马拉雅专辑声音列表采集
喜马拉雅声音评论采集
喜马拉雅主播主页数据采集
喜马拉雅主播主页_专辑列表
喜马拉雅主播主页_声音列表
喜马拉雅搜索列表_主播


喜马拉雅搜索列表_声音为例,介绍怎样使用集搜客来采集数据,步骤如下:
1,安装集搜客数据管家,进入快捷采集,选中喜马拉雅搜索列表_声音,输入关键词搜索后的网址,点击“获取数据”按钮,这样就开始采集数据了。
QQ截图20211029185003.png
2,在快捷采集后台看到采集任务状态变为“已采集”后,就可以点击打包按钮,下载Excel格式的数据了。
QQ截图20211029185613.png
QQ截图20211029185715.png
其他板块的采集方法相同,选中对应的板块入口,输入链接,就可以采集数据了

举报 使用道具
发誓学好内容分析 金牌会员 发表于 2021-10-29 17:47:16 | 显示全部楼层
我也想爬喜马拉雅上的数据,我看到好多毕业论文都是分析喜马拉雅上的每天内容。爬评论,做文本内容分析。集搜客网络爬虫可以下载视频,这个功能我用过,是否有好的方法分析音频内容?
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-29 12:48