我看了这篇文章《微博内容分词后怎样用JupyterNotebook做LDA主题模型分析》,学会了用Python做LDA主题分析。我又看了这么一个内容分析案例《政策工具视角下我国旅游科技政策文本分析研究》,使用政策文件中的条款作为内容分析单元的。

我产生了一个想法,是否可以先用LDA主题分析,然后用主题作为内容分析单元,做编码、分类和统计?


举报 使用道具
| 回复

共 3 个关于本帖的回复 最后回复于 2021-6-23 11:03

Fuller 管理员 发表于 2021-6-23 10:40:46 | 显示全部楼层
你这个项目很有意思,但是我觉得应该纠正一下,仅供探索讨论。
LDA主题分析最后一步一般是要做主题推断,就是决定一篇内容是属于哪个主题。我认为按照你的设想,不要做这个主题分类。而是把要分析的内容向量化。也就是说,本来分析单元是一段话,你嫌读起来太麻烦,先用文档生成算法把原始文档再造一下。再造成一个词向量。然后对着这个向量做编码。

不知道行不行?是否符合内容分析的要求?
举报 使用道具
发誓学好内容分析 金牌会员 发表于 2021-6-23 10:56:14 | 显示全部楼层
Fuller 发表于 2021-6-23 10:40
你这个项目很有意思,但是我觉得应该纠正一下,仅供探索讨论。
LDA主题分析最后一步一般是要做主题推断,就 ...

那我这个想法是不是胡思乱想?
举报 使用道具
Fuller 管理员 发表于 2021-6-23 11:03:12 | 显示全部楼层
发誓学好内容分析 发表于 2021-6-23 10:56
那我这个想法是不是胡思乱想?

我觉得内容分析法是一种量化研究文本内容的研究范式,符合这个范式,可以让研究结论更有说服力。

LDA可以从大量的数据中识别出来潜在主题,我觉得可以尝试用LDA做一些预备工作,协助整理出来编码和分类表。如果全靠一条条看,然后手工整理,应该不如用多轮lda分析快、全面。也许应该尝试一下。

另外,我觉得在大数据工程项目中采用LDA主题分析可以很灵活,有效就行,比如,有这么一个案例《基于LDA主题模型的专利内容分析方法》,我估计这类项目不会按照内容分析范式去做严格的信度和效度分析,只要体验效果符合预期,就行了吧
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-18 09:19