关键词聚类

加为好友

之前看的一篇论文《大学生在线学习体验的聚类分析研究》，里面提到了用卡方统计进行关键词的聚类，但是不懂算法怎么实现的

Fuller · 发表于 2021-9-23 08:10:21

很抱歉目前没法给你明确的建议，因为统计课上学到的知识现在还记住的已经不多了，我只记得卡方是在统计推断那一部分学的，一年年过去了，只记得一些描述性统计方法，统计推断都忘光了。接下来我会专门去复习一下。

处理关键词有很多方法，我觉得可以用其他方法达到目的，统计学方法更加严密，但是机器学习方法更加灵活自由，不见得结果不准确。比如，先用TextRank抽取最重要的关键词，然后利用Word2Vec算出来的词向量求某个词的距离最近的词；我估计也可以先用word2vec求出词向量，然后用k-means之类的聚类算法把词聚一下。

15964002091 · 发表于 2021-9-23 08:57:07

非常感谢，这个Word2Vec求出来的距离最近的词是在原始语料中的吗

Fuller · 发表于 2021-9-23 09:33:39

15964002091 发表于 2021-9-23 08:57
非常感谢，这个Word2Vec求出来的距离最近的词是在原始语料中的吗

对，都是原始语料中的，在这个帖子中，都有这些数据挖掘算法的示例代码，python的：

https://www.gooseeker.com/doc/thread-18414-1-2.html

关键词聚类

共 3 个关于本帖的回复最后回复于 2021-9-23 09:33

推荐板块

精彩推荐

热门话题

热门用户

	B Color Image Link Quote Code Smilies 高级模式您需要登录后才可以回帖登录 \| 立即注册回帖并转播回帖后跳转到最后一页

关键词聚类

共 3 个关于本帖的回复 最后回复于 2021-9-23 09:33

推荐板块

精彩推荐

热门话题

热门用户

共 3 个关于本帖的回复最后回复于 2021-9-23 09:33