2009-01-03

定序变量是否可用t检验?

Sunnysmile @ 2008-12-17:

祝老师您好:我是南开大学的博士生,看到您很多专业的文章和解答,收益颇多,有个问题想请教一下,能否请祝老师百忙中解答:

如果要检验性别与满意度之间的关系可否用t检验?我看有的期刊发表的文章是用的t检验,但是根据SPSS书籍t检验不能分析定序型数据,而满意度应该是定序性数据吧?如果不能用t检验应该用什么统计方法?如果两类数据都是定序数据可以做配对样本t检验吗?非常感谢!

庄主 @ 2009-01-03:

满意度是市场、管理等学科中的一个热门话题,但在我们传播学中并不那么热,所以我对有关文献所知甚少。仅从我偶而看到的文章中,大多是用5级或7级Likert态度量表来测量满意度的。所以你的问题,其实也就是如何分析态度量表的问题,这在传播学乃至整个社会科学各学科倒是有普遍意义的。

是的,态度量表(如“完全同意”、“比较同意”、“一半同意一半不同意”、“不太同意”、“完全不同意”等)是一种定序数据。你的问题是用什么方法来检验自变量为名目变量(性别)、因变量为定序变量(满意度)。这里,首先要区别因变量为单个指标 (single item) 还是合成因子(composite factor)。前者应该用nonparametric test(非参数检验法),如Mann-Whitney U, Kolmogorov-Smirnov Z, Wald-Wolfowitz Runs等,而不应该用t-test。(参见我们《传播统计学》215-219页或SPSS Nonparamatric Tests/2 Independent-Samples Tests/Help等。)

后者(即因变量为由多个指标构成的合成因子)往往可以用参数检验。实际上,绝大多数的态度量表是用来测量一组问题、而不是一个问题。如果该组问题的个数足够多,而且相互之间的一致性高(high consistency or high reliability,即信度高),那么可以将其组合成一个因子(非常常见),该合成因子虽然不等于、但已经“接近”定距变量了。问题的个数越多、每个问题的测量等级越多,其合成因子就越接近定距变量。(很久很久)之前,曾有“100点”(即20个5级或10个10级量表问题)的要求,现在“50点”(10个5级或7个7级量表问题)好像也能过关。我也觉得,“点”再少就有问题了。

除了问题及其等级的个数之外,合成因子的正态分布(即Skewness和Kurtosis都要等于或接近2、并且光滑渐增渐减)也很重要。(参见最近有关正态转换的帖子)

上述想法,与现代SEM的基本思想相仿。如LISREL发明人Joreskog认为,因为隐含因子没有测量单位,我们可以定序的观测变量所对应的隐含因子看做是定距的。他在LISREL的预处理程序PRELIS中,就设置了转换工具,将态度量表之类的定序变量转换成 polychoric correlation,然后再输入LISREL中当作定距变量使用。

最后回答一下你的问题:“如果两类数据都是定序数据可以做配对样本t检验吗?”配对样本指A样本中的每一个案与B样本中的另一个案具有某种内在关联,如夫妻、父子、姐妹、师生、上下级、医生病人、等等,以及同一个案的前后测量值。显然,配对样本的个案之间不是独立观测的(因此其联合标准误差会小一些),需要用paired-test来检验。配对样本是一个数据收集的设计问题,与测量水平无关,不要混在一起。

No comments: