庄文忠 副教授 世新大学行政管理学系 jwj@cc.shu.edu.tw 复回归分析 庄文忠 副教授 世新大学行政管理学系 jwj@cc.shu.edu.tw SPSS之应用(庄文忠副教授) 2019/8/26
课程大纲 复回归分析(Multiple regression analysis)的意 涵 交互作用(Interaction)的处理 虚拟变数(Dummy variable)的处理 多元共线性(Multicollinearity)问题的诊断 模型的比较 SPSS之应用(庄文忠副教授) 2019/8/26
复回归分析(Multiple regression analysis)的意涵 复回归分析是简单回归分析的延伸,用以分析单一依 变项与一群自变项间关系的统计方法,除了必须满足 简单回归分析所要求的基本假定,还必须考虑自变量 之间的关系,尤其是共线性问题(multicollinearity)。 回归方程式 因其考虑较多的自变量对依变量的影响,因此,理论 上,复回归的模型在解释和预测上应较单回归模型更 为精确。 SPSS之应用(庄文忠副教授) 2019/8/26
复回归分析(Multiple regression analysis)的意涵 偏回归系数(partial regression coefficient):当其他变量 X2,X3,…,XP进入模型后,再加入X1时,每增加一 个单位的X1,E(Y)的改变量;或当模型内其他变量 X2,X3,…,XP控制不动时,每增加一个单位的X1, E(Y)改变的量。 标准偏回归系数:将单位去掉后的偏回归系数,可 以判定哪一个自变量对依变量的影响力较大。 复回归分析可能遭遇到的问题: 1.交互作用(interaction)问题 2.虚拟变数(dummy variable)问题 3.多元共线性问题 SPSS之应用(庄文忠副教授) 2019/8/26
交互作用(interaction)的处理 指X1对Y的影响要视X2而定,同样地,X2对Y的影 响要视X1而定,即X1和X2对Y有交互作用。 检定方法: 1. X1和X2单独run回归,若R2为0(或趋近于0),即X1 和X2是无关的。 2.参数比较 3.比较R2 SPSS之应用(庄文忠副教授) 2019/8/26
虚拟变数(dummy variable)的处理 若有类别数据,则必须以虚拟变量的方式处理,新 建的虚拟变量的值只有0和1两类。且必须注意的是, 若有虚拟变量时,则需考虑与其他变量是否有交互 作用存在,因为可能会出现不同的回归线,而不是 只有截距上的差异,除非是证明交互作用不存在后 再自模型中剔除。 建立虚拟变量时,若类别数据X只有2类,则只需 recode成0和1即可;若X有n类,则需新建n-1个虚拟 变数。 SPSS之应用(庄文忠副教授) 2019/8/26
例子:虚拟变量的建立 若地区变量(X2)可分成北、中、南、东等四个区域 compute A1=0. compute A2=0. if (X2=1) A1=1. if (X2=2) A2=1. if (X2=3) A3=1 compute X1A1=X1*A1. compute X1A2=X1*A2. compute X1A3=X1*A3. SPSS之应用(庄文忠副教授) 2019/8/26
多元共线性(Multicollinearity)问题 在使用2个以上的自变量来加强依变量的预测能力 所关连的不仅是各自变量与依变量的相关性而已, 还关系到在回归方程式中已经有的额外自变量与自 变量间的相关性,共线性即是指这群自变量之间的 关联程度,多元共线性指的是3个或以上的自变数 相关性。多元共线性的冲击就是去减少任何与其他 变量有相关的单一自变量之解释力。当共线性增加 时,由每个自变项的预测力降低,而与其他自变量 分享的预测比例上升。 在任何的回归分析中,多元共线性的评估应从两阶 段进行:(1)确认共线性的程度;(2)评估预估系数 影响的程度。 SPSS之应用(庄文忠副教授) 2019/8/26
多元共线性(Multicollinearity)问题 诊断方法: (1)自变量之间相关系数太高;即相关系数全部都在0.3 以下者可接受,若其中有一些在0.7以上,就有共线 性的问题。 (2)增加或减少一个自变量造成回归系数改变。 (3)同一个自变数在与不同的自变数为伍(即放在不同的 回归模型中)时有不同的回归系数或 贡献量。 (4)回归系数的标准误(SE)异常大。 (5)依理论判断回归系数的检定应该显著不为0的,但是 却不显著。 (6)回归系数的符号不正常。 (7)VIF(Variance inflation factor)值太大,或TOLERANCE LEVEL太低。 SPSS之应用(庄文忠副教授) 2019/8/26
模型的比较 在复回归分析中,R2的缺点是当自变量愈多或样本 数小时,会使自由度变小,R2会有高估的情形,并 不是公平的比较方法。 换言之,若在复回归模型中不断加入与模型无关的 自变量时,R2会提高,如此会误导且不能够代表回 归模型的解释能力,故H. Theil建议使用调整后的R2 来调整自变数的数目。只有在选择模型时才需要看 调整后R2。 SPSS之应用(庄文忠副教授) 2019/8/26
复回归分析—只有数字变量 SPSS之应用(庄文忠副教授) 2019/8/26
SPSS之应用(庄文忠副教授) 2019/8/26
分析结果摘要 SPSS之应用(庄文忠副教授) 2019/8/26
多元共线性诊断 SPSS之应用(庄文忠副教授) 2019/8/26
观察值与预测值的比较 SPSS之应用(庄文忠副教授) 2019/8/26
虚拟变量的建立 作法一: 作法二: Compute dsex = 1. If (sex = 2) dsex=0. SPSS之应用(庄文忠副教授) 2019/8/26
交互作用项的建立 作法一: Compute dsexedu = dsex* educyres. 作法二: Compute dsexage = dsex* age. Compute dsexwork = dsex* wrkhrs. 作法二: SPSS之应用(庄文忠副教授) 2019/8/26
复回归分析—加入类别变量与交互作用项 SPSS之应用(庄文忠副教授) 2019/8/26
分析结果摘要 SPSS之应用(庄文忠副教授) 2019/8/26
SPSS之应用(庄文忠副教授) 2019/8/26
复回归分析—删除不显著的自变数 SPSS之应用(庄文忠副教授) 2019/8/26
分析结果摘要 SPSS之应用(庄文忠副教授) 2019/8/26
复回归分析—逐步回归分析法(stepwise) SPSS之应用(庄文忠副教授) 2019/8/26
SPSS之应用(庄文忠副教授) 2019/8/26
各阶段模型的F检定 SPSS之应用(庄文忠副教授) 2019/8/26
各阶段纳入模型的变量 SPSS之应用(庄文忠副教授) 2019/8/26
SPSS之应用(庄文忠副教授) 2019/8/26
操作练习&提问时间 SPSS之应用(庄文忠副教授) 2019/8/26
作业: 自数据文件中选取一个依变量,利用三个的 自变量进行复回归分析,检视这三个变量是 否都有显著的解释力?且对依变量的影响是 否与你(妳)的预期? 选取一个类别变量加入复回归模型中,这个 类别变量是否有显著的解释力?又此一类别 变量与其他三个自变量是否有交互作用存在? 若将分析方法改为「逐步回归分析法」 (stepwise),最后的模型与前一个模型有何差 异? SPSS之应用(庄文忠副教授) 2019/8/26