快捷导航
如题,有一批数据需要按照已经确定的关键词进行分类,该怎么操作
举报 使用道具
| 回复

共 3 个关于本帖的回复 最后回复于 2021-6-21 11:20

wangyong 版主 发表于 2021-6-21 11:00:58 | 显示全部楼层
集搜客文本情感分析工具可以做关键词分类
分类统计.png
下载Excel结果
分类Excel.png
方法很简单,在集搜客文本情感分析工具中导入要分析的数据后,设置分类关键词,还可以设置标签词和排除词作为辅助,然后启动分析就可以实现上图的分析结果了
QQ截图20210620185154.png
举报 使用道具
发誓学好内容分析 金牌会员 发表于 2021-6-21 11:13:52 | 显示全部楼层
还有很多自动化的分类,比如,LDA,word2vec这些,是不是要比手工输入关键词更好?
举报 使用道具
Fuller 管理员 发表于 2021-6-21 11:20:59 | 显示全部楼层
发誓学好内容分析 发表于 2021-6-21 11:13
还有很多自动化的分类,比如,LDA,word2vec这些,是不是要比手工输入关键词更好? ...

这里有一篇文章,专门讲解了怎样用Python调用LDA程序库,对微博内容进行话题分析:《微博内容分词后怎样用JupyterNotebook做LDA主题模型分析》。可以看到,如果没有对原始数据做一些前置处理,直接做LDA分析的效果不好。
而GooSeeker分词和文本分析软件允许用户自己选择特征词,实际上这是特征工程多个方法中的最重要一个:基于专家经验做特征工程。而那些自动化的LDA分析、聚类分析等等,都是利用统计算法自动做特征工程。

如果是做专业的内容分析,分析结果的信度和效度是很重要的,手工选词是最佳方法。
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Jupyter Notebook使用Python做K近邻(KNN)算
  • 基于层次结构和共现关系的在线评论主题图谱
  • 基于因果机制的用户行为研究及应用
  • 改进的K近邻算法及其在文本分析中的应用
  • Jupyter Notebook使用Gensim库做中文Word2V

热门用户

GMT+8, 2021-9-22 17:14