如题,有一批数据需要按照已经确定的关键词进行分类,该怎么操作
举报 使用道具
| 回复

共 3 个关于本帖的回复 最后回复于 2021-6-21 11:20

沙发
wangyong 版主 发表于 2021-6-21 11:00:58 | 只看该作者
集搜客文本情感分析工具可以做关键词分类

下载Excel结果

方法很简单,在集搜客文本情感分析工具中导入要分析的数据后,设置分类关键词,还可以设置标签词和排除词作为辅助,然后启动分析就可以实现上图的分析结果了

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
板凳
发誓学好内容分析 金牌会员 发表于 2021-6-21 11:13:52 | 只看该作者
还有很多自动化的分类,比如,LDA,word2vec这些,是不是要比手工输入关键词更好?
举报 使用道具
地板
Fuller 管理员 发表于 2021-6-21 11:20:59 | 只看该作者
发誓学好内容分析 发表于 2021-6-21 11:13
还有很多自动化的分类,比如,LDA,word2vec这些,是不是要比手工输入关键词更好? ...

这里有一篇文章,专门讲解了怎样用Python调用LDA程序库,对微博内容进行话题分析:《微博内容分词后怎样用JupyterNotebook做LDA主题模型分析》。可以看到,如果没有对原始数据做一些前置处理,直接做LDA分析的效果不好。
而GooSeeker分词和文本分析软件允许用户自己选择特征词,实际上这是特征工程多个方法中的最重要一个:基于专家经验做特征工程。而那些自动化的LDA分析、聚类分析等等,都是利用统计算法自动做特征工程。

如果是做专业的内容分析,分析结果的信度和效度是很重要的,手工选词是最佳方法。
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 话题分析(NMF模型和LDA模型)软件的安装和
  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法
  • 利用AI阅读和分析文本:扣子COZE记录用户反
  • 在网页片段内直观标注——以B站评论采集为

热门用户

GMT+8, 2025-2-6 12:11