利用GooSeeker分词、Ucient和NetDraw进行社会网络分析https://www.gooseeker.com/doc/article-442-1.html

中,
第一步导入的是最开始从网站上面下载下来的包吗

将Excel分列去重后的关键词导入。”为什要导入啊,直接在excel里面做可以吗,好像不用导入啊

请教
举报 使用道具
| 回复

共 4 个关于本帖的回复 最后回复于 2020-6-13 20:29

沙发
Fuller 管理员 发表于 2020-6-13 16:40:06 | 只看该作者
第一步导入的是你要分析的文本内容原数据,比如,一些微博消息。

本来这个软件能够分词,也有一个界面可以筛选词,而这篇文章没有用这个筛选功能,而是有了自己加工好的词汇了,那么,只让集搜客分词软件针对这些准备好的词汇做一下词频统计并导出共现矩阵,所以,就有了这句话 “将Excel分列去重后的关键词导入。”
举报 使用道具
板凳
kodiaxu 高级会员 发表于 2020-6-13 18:00:50 | 只看该作者
怎么可能有些词频是0的,按照上面的方法统计出来的

web of things        0
中文微博        0
谣言传播        0
议程设置        0
相似度算法        0
使用与满足        0
城市新闻广播        0
举报 使用道具
地板
kodiaxu 高级会员 发表于 2020-6-13 18:32:28 | 只看该作者
回到案例二,新建一个Excel,将词语粘贴至第一行和第一列,词语相交的单元格套用刚刚的公式,其他单元格自动拉公式,然后让Excel自行运行计算即可

这里不是很理解,请问是怎么得出那些数字的,好像跳过了一些步奏了
举报 使用道具
5#
kodiaxu 高级会员 发表于 2020-6-13 20:29:00 | 只看该作者
公式应该不是这个
(=SUMIFS($BB,数据!$AA,"*"&$C2&"*",$AA,"*"&D$1&"*"))
请教应该怎么
应该是count 吗
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-20 04:47