面向用户评论的关键词抽取研究-以美团为例》真篇文章很有启发,我大概知道应该怎样做关键词抽取了。我产生了一个问题:

集搜客分词和情感分析软件可以导出共现词矩阵,那么:
1,什么样的词才算共现词?也像那篇文章说的,定义了一个宽度为N的滑动窗口吗?
2,像那篇文章介绍的text Rank方法,从集搜客分词软件导出共现词矩阵以后,是不是就可以计算text rank了?


举报 使用道具
| 回复

共 1 个关于本帖的回复 最后回复于 2021-7-23 12:09

沙发
Fuller 管理员 发表于 2021-7-23 12:09:08 | 只看该作者
这是一个很有意思的问题。集搜客分词和情感分析软件计算共现关系之前先且句子,是按照标点符号切的。所以,就不是固定宽度的滑动窗口,可以看到可变宽度的不滑动的窗口。我估计这两种方法的计算结果的精度差别不大。

导出矩阵表以后,如果你有比较好的程序库,比如,python的程序库,那么就可以比较容易计算text rank了
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 话题分析(NMF模型和LDA模型)软件的安装和
  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法
  • 利用AI阅读和分析文本:扣子COZE记录用户反
  • 在网页片段内直观标注——以B站评论采集为

热门用户

GMT+8, 2025-2-6 14:59