2009-01-01

回归分析前是否需要对变量进行正态性检验?

dylan @ 2008-12-23:

祝老师,你好!有的书上讲在进行回归分析之前首先要对自变量和因变量都要进行正态性检验,如果检验失败,则进行对数变换,而有的书上在讲回归分析时,则根本不提对于变量的正态性检验问题,只是对残差进行正态性检验,某些论坛上也有讨论,但是没有权威结论,因此想请您给个明确答案,谢谢!

庄主 @ 2009-01-01:

是的,不仅是回归分析,而且几乎所有的parametric statistical tools (参数统计工具),都有这种要求。如回归分析、相关分析、结构方程模型等,要求自变量和因变量都服从正态分布;logistic回归要求自变量服从正态分布;t-检验和方差分析要求因变量服从正态分布。只有non-parametric tools(非参数统计工具),如卡方分析、loglinear等,才没有这种要求。

也就是说,如果自变量和/或因变量不服从正态分布,就不能直接使用参数统计工具,而先要对有关变量做正态转换。具体参见前几天的帖子“如何在SPSS中做数据正态转化?”。

你提到,有些统计书建议在回归分析之后,对残差做正态检验,这完全是另一回事。即使一对自变量和因变量都服从正态分布,但其残差也可能不服从正态分布,其原因或者在于没有控制“第三者”变量、或自变量与因变量之间的关系是非线性等等。残差分析的目的在于寻找如何进一步提高回归模型的拟合度的线索。

No comments: