在CSDN上有这样一个帖子《共现矩阵》,它给出的截图,对角线上的数字全部是0,而集搜客分词和文本分析软件导出的数字不是0,对于共词分析和度分析有没有影响。
我还看到这么一个帖子:
因为TFIDF算法的提取关键词的准确性很差,tfidf提取出的关键词很难看出文本的主旨,于是考虑结合文本语义对词汇的权重(IDF)重新分配,于是想要借鉴SKE算法,即将词语语义特征融入关键词提取过程中,构建词语语义相似度网络并利用居间度密度度量词语语义关键度。
因为构造词语网络需要先构造关键词共现图,关键词共现图需要先构造关键词共现矩阵,所以第一步就是构造关键词共现矩阵。
还有程序:《关键词提取:构造共现矩阵》。我准备模仿写个程序试试
|
|
|
|
|
共 4 个关于本帖的回复 最后回复于 2022-12-29 10:32