我看到大家讨论了很多内容分析需要的抽样、编码,对我的学习很有帮助,我现在有个疑问:我在学统计的时候学到的因子分析和主成分分析是否能用在内容分析任务中?
举报 使用道具
| 回复

共 6 个关于本帖的回复 最后回复于 2020-2-7 12:11

沙发
Fuller 管理员 发表于 2020-2-7 11:10:54 | 只看该作者
前面我们很多关于内容分析的讨论帖都是在讨论抽样和编码。一个简单的内容分析任务,可能在编码以后对分析单位做些计数,对类目做些计数和比较,然后再提取一些参考点内容作为佐证,就可以完成一个分析报告了。

但是,内容分析其实是一种量化分析,那么因子分析和主成分分析是做进一步分析所必然采用的。所以,集搜客分词和文本分析平台的一项主要功能是把加工好的内容导出成excel,方便导入到统计分析工具中做进一步的量化计算
举报 使用道具
板凳
发誓学好内容分析 金牌会员 发表于 2020-2-7 11:14:21 | 只看该作者
Fuller 发表于 2020-2-7 11:10
前面我们很多关于内容分析的讨论帖都是在讨论抽样和编码。一个简单的内容分析任务,可能在编码以后对分析单 ...

关于主成分分析和因子分析,其实学的有点迷迷糊糊,看别人的分析案例,一会出现因子分析,一会出现主成分分析,似乎两者是一样的,都是想确定更能解释一个现象的解释因素,他们是一样的吗?
举报 使用道具
地板
Fuller 管理员 发表于 2020-2-7 11:38:17 | 只看该作者
发誓学好内容分析 发表于 2020-2-7 11:14
关于主成分分析和因子分析,其实学的有点迷迷糊糊,看别人的分析案例,一会出现因子分析,一会出现主成分 ...

量化分析的时候,用数据指标描述一个现象,这是观察变量,而解释这个现象的数据指标,是潜变量。无论是因子分析还是主成分分析都是要确定少量的最有解释力的潜变量来解释一个现象,因为脑子能理解的数量是有限的。

最大的区别是:因子分析中,有解释力的少量变量就是从原先更多的潜变量中找的;而主成分分析却不限于原先的变量,可能是原先的变量经过线性变换后构造出来的新变量。
举报 使用道具
5#
发誓学好内容分析 金牌会员 发表于 2020-2-7 11:41:08 | 只看该作者
Fuller 发表于 2020-2-7 11:38
量化分析的时候,用数据指标描述一个现象,这是观察变量,而解释这个现象的数据指标,是潜变量。无论是因 ...

那为什么要做变换呢?不变化不行吗?
举报 使用道具
6#
Fuller 管理员 发表于 2020-2-7 11:55:15 | 只看该作者
发誓学好内容分析 发表于 2020-2-7 11:41
那为什么要做变换呢?不变化不行吗?

不变换也不是不行,很多时候也不用主成分分析。不变换只是解释力不太够。

有句诗:横看成岭侧成峰

假设有两座山,都看起来是“峰”,两个是不是真的一样?从侧面测量的这个指标可能很难准确解释一个目标。要做一个线性变换,在统计学上有个指标:方差,是用来看辨识度的,越大越有辨识度,直观的理解就是经过变换以后,测量出来的数据点要从多个方向看都是尽量分散的。

这里有一个知乎回答:《如何通俗易懂地讲解什么是 PCA 主成分分析?
举报 使用道具
7#
ym 版主 发表于 2020-2-7 12:11:13 | 只看该作者
发誓学好内容分析 发表于 2020-2-7 11:14
关于主成分分析和因子分析,其实学的有点迷迷糊糊,看别人的分析案例,一会出现因子分析,一会出现主成分 ...

主成分分析和因子分析都是反映了数据降维的思想。通过降维将相关性高的变量聚在一起,从而减少需要分析的变量的数量,进而减少问题分析的复杂性。

两者的区别是在降维目的上有些差异。

主成分分析是对于原先提出的所有变量,将重复的变量(关系紧密的变量)删去多余,建立尽可能少的新变量,使得这些新变量是两两不相关的。即从原始变量中导出少数几个主成分,使它们尽可能多地保留原始变量的信息,且彼此间互不相关。

因子分析是通过研究变量之间是否具有相关关系,寻找潜在的、起支配作用的因子,把原始变量转变为新的因子,这些因子之间的相关性较低,而因子内部的变量相关程度较高。

降维之后,可以进一步做聚类或回归分析。

举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 360或火绒等杀毒软件导致GooSeeker爬虫软件
  • 话题分析(NMF模型和LDA模型)软件的安装和
  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法
  • 利用AI阅读和分析文本:扣子COZE记录用户反

热门用户

GMT+8, 2025-4-22 20:13