按照老师的要求,要用聚类算法对一些微博内容进行分析。我看了多篇在Jupyter Notebook下用LDA主题模型分析微博数据的文章,比如:
1. 微博内容分词后怎样用JupyterNotebook做LDA主题模型分析
2. 微博内容分词并手工选词后用JupyterNotebook做LDA主题分析

觉得很有用,但是,聚类算法和LDA主题分析有什么区别?是一回事吗?


举报 使用道具
| 回复

共 1 个关于本帖的回复 最后回复于 2021-6-25 11:50

Fuller 管理员 发表于 2021-6-25 11:50:17 | 显示全部楼层
知乎上有个类似的问题: 对比传统K-Means等聚类算法,LDA主题模型在文本聚类上有何优缺点? ,摘录如下:
本人大三,最近在跟导师做自然语言相关研究,由于刚刚入门,接触并简单测试了一下LDA,感觉不是特别清楚,LDA是不是就是把文本按主题聚类?其对比其他传统聚类算法有何优缺点?

有些回答提到了LDA,PLSA,还有更多很详细的说明。我认为LDA也可以算作聚类的一种算法。
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-29 23:27