1,穷尽原则
2,互斥原则
3,独立原则
举报 使用道具
| 回复

共 3 个关于本帖的回复 最后回复于 2020-8-19 15:11

王建国 高级会员 发表于 2020-8-19 14:41:58 | 显示全部楼层
本帖最后由 王建国 于 2020-8-19 15:13 编辑

1,穷尽原则就是说需要分类的样本单元必须都有所归属,即每个单元都有相应的编码。比如,报纸的报道题材,如果我们按照政治、经济、文化、娱乐来分类,就还有其他的没有涉及,诸如体育、天气预报等。当然,这并不是说要对每一种可能都列出类目。许多变量是比较容易穷尽的,比如,男女;而另外一些则比较难。通常的做法是在主要关注的类项外,用“其他”类来达到穷进性。
举报 使用道具
王建国 高级会员 发表于 2020-8-19 15:00:04 | 显示全部楼层
本帖最后由 王建国 于 2020-8-19 15:14 编辑

2,互斥原则
即唯一性原则,一个人是男人,就不能同时是女人。比如下面类目变量:
1,工人
2,农民
3,学生
4,军人
5,大学生
6,白领
7,蓝领
8,其他
上面的类项明显互相包含,你中有我,我中有你。某个人可以同时是工人和蓝领。这样的问题是把不同维度的东西混在一起了。解决的办法是根据新的维度,重新加入变量进行分类。
比如,在工人下面,加入区分白领、蓝领的变量。当然这也要看研究的需要,同时也应该注意这样的变量本身是否恰当实际。比如,在分析中国媒体人物形象的类项中,加入种族一项是否有实际意义。
举报 使用道具
王建国 高级会员 发表于 2020-8-19 15:11:17 | 显示全部楼层
3,独立原则
独立原则是一种归属不能影响到另外类目的归属。这样的问题常出现在排序的变量上。这就好比老三变成老大,那么老大则需要变成老二。
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-29 23:45