论文首页哲学论文经济论文法学论文教育论文文学论文历史论文理学论文工学论文医学论文管理论文艺术论文 |
根据以上的,我们可以初步列出此模型:
图2所示为残差的正态P-P图,可以由此观察残差分布是否正态。可见散点基本呈直线趋势,可以认为因变量服从正态分布。
图 SEQ 图 \* ARABIC 2 残差的正态p-p图
三、共线性检验及其处理——主成分分析
在多重回归分析中,无法避免的一个问题就是多重共线性问题。所谓多重共线性是指自变量之间存在近似的线性关系,即某个自变量能近似的用其他自变量的线性函数来表示。一般而言,自变量较低程度上的相关不会对回归结果造成严重影响,然而,当共线性趋势非常明显时,就会对模型的拟合带来严重影响。一般来说,如果两个自变量的相关系数超过0.9,对模型的影响就会很大。当然,仅靠相关系数仅仅是初步判断,实践中借助SPSS,常常使用方差膨胀因子、特征根或条件指数来判断。当膨胀因子大于10、特征根为0或条件指数大于30时,提示存在共线性。
在SPSS中,共线性诊断仍然是通过多元线性回归分析来实现的。表6是SPSS线性诊断的结果,从中我们可以发现,特征根有两项为0,条件指数有两项分别为178.8、199.3,在常数项、城市化和人均GDP这三项中,VP值均很高,分别为0.99、0.85、0.93,提示三者高度相关。原回归模型存在严重的共线性,我们必须对其进行处理。
表 SEQ 表 \* ARABIC 6线性诊断的结果
共线性处理有多种方法,其中比较常用的是主成分回归。所谓主成分回归分析就是试图以较少的相互独立的指标来代替原来的多个指标,新指标包含了原指标的主要信息。上文给出的模型既然存在着共线性问题,下面就用主成分回归的方法来解决。
首先我们要确定原自变量的均数、标准差等信息,具体可见表7.
表 SEQ 表 \* ARABIC 7 原指标的描述信息