网络图20200311160638.png

我的论文要分析微博数据,针对当前的事件做量化分析。我看到人大新闻系公众号里面有篇文章《议题、情绪和话语》,他们使用了清博大数据。
我想问这个网络图是怎么生成的?我有没有办法在自己的论文中也做这样的图?

举报 使用道具
| 回复

共 16 个关于本帖的回复 最后回复于 2020-3-12 10:25

微舆情 高级会员 发表于 2020-3-11 16:19:56 | 显示全部楼层
首先是源数据的准备吧: 确定要分析哪个时间段的微博数据, 然后用微博工具箱获取到这些数据
举报 使用道具
发誓学好内容分析 金牌会员 发表于 2020-3-11 16:22:40 | 显示全部楼层
微舆情 发表于 2020-3-11 16:19
首先是源数据的准备吧: 确定要分析哪个时间段的微博数据, 然后用微博工具箱获取到这些数据 ...

这个我会了,我用集搜客微博采集工具箱的关键词搜索采集工具、话题广场采集工具、评论和转发采集工具、博主的微博采集工具,已经采集了很多数据,从1月初就开始采集了
举报 使用道具
ym 版主 发表于 2020-3-11 16:36:11 | 显示全部楼层
本帖最后由 ym 于 2020-3-11 18:28 编辑

要生成这个网络图,关键是要统计出词语两两共现次数的共词矩阵表,而集搜客有一系列配套的文本处理工具,按以下几个步骤来做就可以获得这个共词矩阵表。
(1)获取微博数据,推荐用集搜客的微博工具来搜集数据
(2)对微博的文本做处理,包括文本切词、选出高频词或特征词,这个用集搜客的分词和分析平台的分词选词功能就能满足
(3)然后用集搜客的分词和分析平台的社会网络功能,启动共词匹配,不仅可以得到共词矩阵表,还可以直接生成网络图
QQ截图20200311163554.png

举报 使用道具
微舆情 高级会员 发表于 2020-3-11 16:37:11 | 显示全部楼层
数据准备好了, 下一步可以使用集搜客的分词工具: 新建一个分析任务, 把样本数据加载进去
举报 使用道具
微舆情 高级会员 发表于 2020-3-11 16:44:28 | 显示全部楼层
ym 发表于 2020-3-11 16:36
要生成这个网络图,关键是要统计出词语两两共现频数的共词矩阵表,而集搜客有一系列配套的文本处理工具,按 ...

我看清博大数据的这个话题网络图的说明:取50个高频词,做出共现矩阵
这一步如果是用集搜客分词工具来做, 第一步应该是先从词频统计里挑选出50个高频词。
第二步,怎么只生成这50个高频词的共现矩阵?
举报 使用道具
Fuller 管理员 发表于 2020-3-11 16:48:43 | 显示全部楼层
虽然用图看起来挺酷,但是我在论文中要准确得到每个词的中心度,以及按照中心度的排序,集搜客软件能帮我做这个工作吗?
举报 使用道具
lan_1985 金牌会员 发表于 2020-3-11 18:07:25 | 显示全部楼层
微舆情 发表于 2020-3-11 16:44
我看清博大数据的这个话题网络图的说明:取50个高频词,做出共现矩阵
这一步如果是用集搜客分词工具来做 ...

我也在试着做这个图,选词这里有个疑问,如果我按顺序,整页选择是否合理。
QQ图片20200311180454.png
举报 使用道具
ym 版主 发表于 2020-3-11 18:22:10 | 显示全部楼层
Fuller 发表于 2020-3-11 16:48
虽然用图看起来挺酷,但是我在论文中要准确得到每个词的中心度,以及按照中心度的排序,集搜客软件能帮我做 ...

集搜客分词分析平台的网络图是一个无向图,中心度越大,词语的圆点就越大,把鼠标悬放在词语上面,就能看到该词的中心度数值。导出共词矩阵表,表里的词语是默认按中心度从大到小排列
举报 使用道具
Fuller 管理员 发表于 2020-3-11 18:23:58 | 显示全部楼层
ym 发表于 2020-3-11 18:22
集搜客分词分析平台的网络图是一个无向图,中心度越大,词语的圆点就越大,把鼠标悬放在词语上面,就能看 ...

是的,能导出按照中心度排序的数据表很有用,就可以用数据做下一步的分析
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-29 03:23