现在网红很热,我想写一篇分析网红现象的论文,我打算用网络爬虫抓取B站弹幕数据,用集搜客文本分析工具分析抓下来的文字,是否可行?

举报 使用道具
| 回复

共 3 个关于本帖的回复 最后回复于 2021-6-2 16:31

沙发
Fuller 管理员 发表于 2021-6-2 16:00:59 | 只看该作者
这是一个很好的研究方向,也是很有意义的方向。可以使用集搜客网络爬虫软件抓取B站数据,然后导出抓取结果,是Excel格式的,把一些不必要的字段删除,留下正文就好,最好再增加一列“序号”,给每条正文编号,便于统计分析的时候使用序号明确对应哪条数据。把这个经过简单整理的excel表格导入到GooSeeker分词和文本分析软件中,会自动分词。还可以做好多分析,比如,分类,情感分析,社交关系分析等等。这里罗列了教程和使用案例:https://www.gooseeker.com/doc/thread-15199-1-1.html
举报 使用道具
板凳
Fuller 管理员 发表于 2021-6-2 16:04:18 | 只看该作者
我搜索了一下网络,还真有不少这样的研究,可以参考一下。比如,知网上这个文章:网红主播现象与B站弹幕狂欢引发的思考  ,是2021年度北京社科重点项目“北京青少年社交媒体使用与表达的研究”(编号:SZ202111626025)成果
举报 使用道具
地板
wangyong 版主 发表于 2021-6-2 16:31:09 | 只看该作者
B站的弹幕不是很好采集,而且B站本身也对弹幕列表上的弹幕做了限制。

不如采集评论和评论回复内容来做分析吧

采集评论和回复很简单,集搜客的快捷采集有B站视频采集_评论B站视频采集_评论和回复
选择采集入口输入视频链接,就可以启动采集了,采集完后可以下载Excel格式的数据,将采集结果导入到文本分词情感分析软件中,会自动分词。还可以做好多分析,比如,分类,情感分析,社交关系分析等等




举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-19 22:41