2009-02-10

如何检验男女两组回归系数之间的差别?


罗拉 @ 2009-02-06:

在SPSS中以性别为分组变量做分组回归,应该如何比较回归系数的差异?

庄主 @ 2009-02-08:

如果你问的是如何解读性别的回归系数,请参见我刚发的“回归与GLM分析结果真的不同吗?”。

罗拉 @ 2009-02-08:

这个问题我想问的是如果使用SPSS将相同的回归方程分别用于男生和女生数据,比如:女生组:y1=a1+b1x+c1z 男生组:y2=a2+b2x+c2z,这时该如何看y1和y2是否等同,也就是如何得到AMOS跨组比较中模型对男女是否等同的结果呢?

小彭 @ 2009-02-09:

To 罗拉:你是要检测交互效果吗?如果是,在SPSS里面可以创造一个交互变量。在AMOS(严格说是在SEM)里,可以用多组比较的办法。

罗拉 @ 2009-02-09:

To 小彭:我是想把性别作为调节变量,在AMOS里用多组比较的方法,从结果报告的P值可以看出模型对男女是否等同,但是如果在spss里对男女分别做回归,该如何看两个方程式是否有差异呢,印象中有个公式可以判别,但是实在想不出了。

庄主 @ 2009-02-10:

To 罗拉:以下回答以你的两个公式为基础:女生组:y1=a1+b1x+c1z; 男生组:y2=a2+b2x+c2z。

1. 比较两个回归系数之间差别的公式为:(b1-b2)/se12,其中b1和b2是被比较的回归系,se12是两者的Join Standard Error(联合标准误差),其结果是一个以自由度为n-k-2的t分布(其中n是样本量、k是原来的自变量数,本案中为x和c两个)。

2. 在SPSS(其实是任何OLS回归)中,你如果将男女分成两个样本分布做回归,可以得到b1和b2,但得不到联合标准误差se12(因为b1和b2出现在不同的模型中国),所以无法用到上述公式。

3. SEM(包括AMOS)是通过比较男女样本的拟合度之差别来比较两组回归系数之间的等同性,这种方法在OLS回归中并不适用。同时,SEM的这种做法是有代价的:它将一个总样本分成两个小样本,其结果是降低了Power of Analysis (统计分析效力),从而在没有降低犯Type I的误差的同时又提高了犯Type II误差。

4. 更合理的方法是男女不分组、保留在同一样本内,将性别转换成dummy变量,再生成性别与你想比较的自变量(如X)的交互变量(如X*性别),这就是我和小彭各自发的前贴的意思。也就是说,将你的公式1(或公式2)中改成:

Y = a + bX + cZ + dS +eSX + fSZ

其中S是性别(假定男=0、女=1),SX是性别与X的交互变量、SZ是性别与Z的交互变量。如果男女在S上的取值(即0和1)代人该公式,就可以分解成以下两个公式(注意:样本还是一个):

女生组(S=1):Y = a + bX + cZ + d1 +e1X + f1Z = (a+d) + (b+e)X + (c+f)Z

男生组(S=0):Y = a + bX + cZ + d0 + e0X + f0Z = a + bX + cZ

如果d是显著的(即男女本身之差别),就说明女生在Y上的截距(即平均值)比男生高d个单位(见以下左右图的截距);如果e是显著的(即性别对X与Y之关系的影响),就说明女生的X斜率比男生大e个单位(见左下图红线的斜率);如果f是显著的(即性别对Z与Y之关系的影响),就说明女生的Z斜率比男生大f个单位(见右下图紫线的斜率)。

Interaction between sexes

注:上两图应该是合并在一个三维图,但是不容易看清楚,所以分开来画。

如何生成SX、SZ、如何防止S、X、Z、SX和SZ的共线性等具体操作问题,可参见本庄已有的好几个有关帖子。

1 comment:

阳光 said...

庄主:您好!有两个问题,一是,为什么你以前的帖子打不开;二是同这个帖子有个的问题。如果检验的不是两组而是多组回归系数之间的差别,如三组(一级、二级和三级),那么按照您的思路,回归方程是否应当如下:Y = a + bX + cZ + dS1+eS2 +fS1X +gS2X+hS1Z+iS2Z?