设为首页 登录 注册
首页 中人社区 中人博客
中人网 > 中人社区 > Kenneth的空间 > 博客
两个回归系数是否相等的问题
2009-04-14 17:37:20
香港科技大学博士生张玲玲(Lida Zhang)问我关于以上的问题,我给了她一点指引。很难得的,她竟然问我可否把她学习得来的心得与网友分享。我当然是欢喜也来不及啦。以下是她寄给我的内容,在这里与大家分享。


×××××××××××××××


其实我最初的问题是:

1)如果知道两个变量X(例如: IQ)和V(例如:EQ)都会影响Y(例如:工作表现),如何比较XY的影响与VY的影响在某一个样本中是否显著不同?

2)如果知道变量X(例如: IQ)会影响变量Y(例如:工作表现),如何比较XY的影响在两个独立样本S 1 (例如:男性)和S 2 (例如:女性)中是否显著不同?

 

这两个问题都可以通过三种不同的方法比较:比较相关系数、比较回归系数、利用回归方程分析比较。但是由于(1)是关于来自同一样本的变量关系比较问题,而(2)是关于来自两个独立样本的变量关系比较问题,解决这两个问题的细节会略有不同。

 

方法一:比较相关系数

 

问题(1)参见Cohen & Cohen (1983, p. 57)

 

其中, rxyXY的相关系数, rvyVY的相关系数, rxvXV的相关系数,n是样本容量,



进行自由度为n-3t检验即可知道rxyrvy是否显著不同。

 

问题(2)参见Cohen & Cohen (1983, p. 53-54Fisher’s z’ transformation)

 

     

其中, r1XY在样本S1中的相关系数, n1S1的样本容量, r2XY在样本S2中的相关系数,n2S2的样本容量

 

z遵从正态分布,从而可以知道r1r2是否显著不同。

 


方法二:比较回归系数

 

问题(1)参见Cohen & Cohen (1983, p. 479-480)

 

回归方程 Y = β0 + βx X + βv V + ......

 


其中,β0, βx, βv 均为标准化回归系数, SEβx-βv βx-βv的标准差,n是样本容量, k是自变量的数量, R2y.xv是被所有自变量解释的Y的方差的比例, rxx, rvv, rxv 均出自于自变量相关系数的逆矩阵(可以通过SPSS报告的“tolerance”来计算), 1-R2x表示跟其它自变量不相关的 X的方差的比例(就是SPSS报告的X“tolerance”), 1-R2v表示跟其它自变量不相关的V的方差的比例(就是SPSS报告的V“tolerance”), prxvXV的偏相关系数(控制其它自变量)

 

进行自由度为n-k-1t检验即可知道βx βv是否显著不同。

 

问题(2)参见Cohen & Cohen (1983, p. 109-111)

 

样本S1回归方程  Y = β0 + β1 X +  ......

样本S2回归方程  Y = β0 + β2 X +  ......




 

其中,β0, β1, β2 均为标准化回归系数, SEβ1 β1的标准差, SEβ2β2的标准差, n1S1的样本容量,n2S2的样本容量,k是自变量的数量, R2y1是样本S1中被所有自变量解释的Y的方差的比例, R2y2是样本S2中被所有自变量解释的Y的方差的比例,

1-R21表示样本S1中跟其它自变量不相关的 X的方差的比例(就是SPSS报告的X“tolerance”),

1-R22表示样本S2中跟其它自变量不相关的X的方差的比例(就是SPSS报告的X“tolerance”

 

z遵从正态分布,从而可以知道 β1β2是否显著不同。

 

 

 

方法三:利用回归方程分析比较

 

问题(1)参见Neter, Wasserman, & Kutner (1989, p. 98-99, p. 284)

 

回归方程一(Full Model):

     Y =  β0 + βx X + βv V + ......

回归方程二(Reduced Model):

     Y =  β0 + βx (X +V ) + ......

 

(来自 Y =  β0 + βx X + βv V + ......; βx = βv =β1

 


 

其中,SSE(F)是方程一的Error Sum of Squares dfF是方程一的自由度,SSE(R)是方程二的 Error Sum of Squares dfR是方程二的自由度

 

进行自由度为(dfR-dfF ; dfFF检验即可知道βx βv是否显著不同。

 

问题(2XS的交互作用(将两个样本合并)

 

回归方程 Y =  β0 + βx X + βs S + βxs XS ...

 

其中,自变量S表示来自于哪一个样本

 

如果βxs显著,那么XY的影响在样本S1和样本S2显著不同。

 

 

参考文献:

Cohen, J. Cohen, P. (1983). Applied Multiple Regression/Correlation Analysis for the Behavioral Sciences. 2nd Edition, Hillsdale, NJ:Erlbaum.

Neter, J., Wasserman, W., & Kutner, M. H. (1989). Applied Linear Regression Models. 2nd Edition, Homewood, IL: Irwin.


×××××××××××××××


最后,我多加一句。现在结构方程建模SEM这样流行,其实(1)两个回归系数在同一个样本是否相同,或者是(2)两个回归系数在不同样本是否相同的问题,也可以用结构方程建模来解决的,那大家就可以避免繁杂的数学公式和 "估计标准误差" (standard error of estimates) 的问题了。


《完》