第十三章 检验与方差分析 我们前面已经比较系统地讨论了双样本的参数和非参数检验的问题。现在,我们希望利用一般的方法来检验三个以上样本的差异, 检验法和方差分析法就是解决这方面问题的。 检验法可以对拟合优度和独立性等进行检验,方差分析法则可以对多个总体均值是否相等进行检验。后者由于通过各组样本资料之间的方差和组内方差的比较来建立服从F分布的检验统计量,所以又称F检验。

Slides:



Advertisements
Similar presentations
一、 一阶线性微分方程及其解法 二、 一阶线性微分方程的简单应用 三、 小结及作业 §6.2 一阶线性微分方程.
Advertisements

第五节 函数的微分 一、微分的定义 二、微分的几何意义 三、基本初等函数的微分公式与微分运算 法则 四、微分形式不变性 五、微分在近似计算中的应用 六、小结.
2.8 函数的微分 1 微分的定义 2 微分的几何意义 3 微分公式与微分运算法则 4 微分在近似计算中的应用.
第七节 函数的微分 一 、微分 概念 二、微分的几何意义 三、 基本初等函数的微分公 式与 微分运算法则 四 、小结.
2.6 隐函数微分法 第二章 第二章 二、高阶导数 一、隐式定义的函数 三、可微函数的有理幂. 一、隐函数的导数 若由方程 可确定 y 是 x 的函数, 由 表示的函数, 称为显函数. 例如, 可确定显函数 可确定 y 是 x 的函数, 但此隐函数不能显化. 函数为隐函数. 则称此 隐函数求导方法.
2.5 函数的微分 一、问题的提出 二、微分的定义 三、可微的条件 四、微分的几何意义 五、微分的求法 六、小结.
第三节 微分 3.1 、微分的概念 3.2 、微分的计算 3.3 、微分的应用. 一、问题的提出 实例 : 正方形金属薄片受热后面积的改变量.
3.4 空间直线的方程.
第六章 回归分析.
第十章 相关与回归分析 PowerPoint 统计学.
圆的一般方程 (x-a)2 +(y-b)2=r2 x2+y2+Dx+Ey+F=0 Ax2+Bxy+Cy2+Dx+Ey+ F=0.
第三章 函数逼近 — 最佳平方逼近.
10.2 立方根.
6.6 单侧置信限 1、问题的引入 2、基本概念 3、典型例题 4、小结.
完全随机设计多样本资料秩和检验.
《高等数学》(理学) 常数项级数的概念 袁安锋
一、原函数与不定积分 二、不定积分的几何意义 三、基本积分公式及积分法则 四、牛顿—莱布尼兹公式 五、小结
第四章 函数的积分学 第六节 微积分的基本公式 一、变上限定积分 二、微积分的基本公式.
田间试验和统计方法 第九章 直线回归与相关.
第5章 定积分及其应用 基本要求 5.1 定积分的概念与性质 5.2 微积分基本公式 5.3 定积分的换元积分法与分部积分法
第三篇 医学统计学方法. 第三篇 医学统计学方法 医学统计学方法 实习2 主讲人 陶育纯 医学统计学方法 实习2 主讲人 陶育纯 流行病与卫生统计学教研室
第三节 函数的求导法则 一 函数的四则运算的微分法则 二 反函数的微分法则 三 复合函数的微分法则及微分 形式不变性 四 微分法小结.
不确定度的传递与合成 间接测量结果不确定度的评估
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
2-7、函数的微分 教学要求 教学要点.
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
余角、补角.
第三章 多维随机变量及其分布 §2 边缘分布 边缘分布函数 边缘分布律 边缘概率密度.
§3.3 多元线性回归模型的统计检验 一、拟合优度检验 二、方程的显著性检验(F检验) 三、变量的显著性检验(t检验) 四、参数的置信区间.
例1 :甲击中的环数; X :乙击中的环数; Y 平较高? 试问哪一个人的射击水 : 的射击水平由下表给出 甲、乙两人射击,他们
一元线性回归模型 § 1 回归分析概述 § 2 一元线性回归模型的参数估计 § 3 一元线性回归模型的统计检验
 做一做   阅读思考 .
第2章 一元线性回归 2 .1 一元线性回归模型 2 .2 参数 的估计 2 .3 最小二乘估计的性质 2 .4 回归方程的显著性检验
元素替换法 ——行列式按行(列)展开(推论)
§2 求导法则 2.1 求导数的四则运算法则 下面分三部分加以证明, 并同时给出相应的推论和例题 .
第十章 方差分析.
统 计 学 (第三版) 2008 作者 贾俊平 统计学.
第七章 参数估计 7.3 参数的区间估计.
若2002年我国国民生产总值为 亿元,如果 ,那么经过多少年国民生产总值 每年平均增长 是2002年时的2倍? 解:设经过 年国民生产总值为2002年时的2倍, 根据题意有 , 即.
第一章 函数与极限.
习题 一、概率论 1.已知随机事件A,B,C满足 在下列三种情况下,计算 (1)A,B,C相互独立 (2)A,B独立,A,C互不相容
抽样和抽样分布 基本计算 Sampling & Sampling distribution
Partial Differential Equations §2 Separation of variables
9.1 简单线性相关分析 9.2 一元线性回归分析 9.3 多元线性回归与复相关分析 9.4 变量间非线性关系的回归
3.8.1 代数法计算终点误差 终点误差公式和终点误差图及其应用 3.8 酸碱滴定的终点误差
概 率 统 计 主讲教师 叶宏 山东大学数学院.
线 性 代 数 厦门大学线性代数教学组 2019年4月24日6时8分 / 45.
5.2 常用统计分布 一、常见分布 二、概率分布的分位数 三、小结.
复习.
成绩是怎么算出来的? 16级第一学期半期考试成绩 班级 姓名 语文 数学 英语 政治 历史 地理 物理 化学 生物 总分 1 张三1 115
第16讲 相似矩阵与方阵的对角化 主要内容: 1.相似矩阵 2. 方阵的对角化.
§6.7 子空间的直和 一、直和的定义 二、直和的判定 三、多个子空间的直和.
相关与回归 非确定关系 在宏观上存在关系,但并未精确到可以用函数关系来表达。青少年身高与年龄,体重与体表面积 非确定关系:
第五节 缓冲溶液pH值的计算 两种物质的性质 浓度 pH值 共轭酸碱对间的质子传递平衡 可用通式表示如下: HB+H2O ⇌ H3O++B-
概 率 统 计 主讲教师 叶宏 山东大学数学院.
第一节 不定积分的概念与性质 一、原函数与不定积分的概念 二、不定积分的几何意义 三、基本积分表 四、不定积分的性质 五、小结 思考题.
第三章 函数的微分学 第二节 导数的四则运算法则 一、导数的四则运算 二、偏导数的求法.
第4课时 绝对值.
学习任务三 偏导数 结合一元函数的导数学习二元函数的偏导数是非常有用的. 要求了解二元函数的偏导数的定义, 掌握二元函数偏导数的计算.
第一部分:概率 产生随机样本:对分布采样 均匀分布 其他分布 伪随机数 很多统计软件包中都有此工具 如在Matlab中:rand
第四节 多个样本均数的两两比较 多个样本均数的两两比较又称多重比较(multiple comparison),其目的是推断究竟哪些总体均数之间存在差别。
分数再认识三 真假带分数的练习课.
第15讲 特征值与特征向量的性质 主要内容:特征值与特征向量的性质.
§5.2 抽样分布   确定统计量的分布——抽样分布,是数理统计的基本问题之一.采用求随机向量的函数的分布的方法可得到抽样分布.由于样本容量一般不止2或 3(甚至还可能是随机的),故计算往往很复杂,有时还需要特殊技巧或特殊工具.   由于正态总体是最常见的总体,故本节介绍的几个抽样分布均对正态总体而言.
概率论与数理统计B.
第二节 函数的极限 一、函数极限的定义 二、函数极限的性质 三、小结 思考题.
第三节 随机区组设计的方差分析 随机区组设计资料的总平方和可以分解为三项: (10.10).
第十五讲 区间估计 本次课讲完区间估计并开始讲授假设检验部分 下次课结束假设检验,并进行全书复习 本次课程后完成作业的后两部分
第三章 从概率分布函数的抽样 (Sampling from Probability Distribution Functions)
一元一次方程的解法(-).
Presentation transcript:

第十三章 检验与方差分析 我们前面已经比较系统地讨论了双样本的参数和非参数检验的问题。现在,我们希望利用一般的方法来检验三个以上样本的差异, 检验法和方差分析法就是解决这方面问题的。 检验法可以对拟合优度和独立性等进行检验,方差分析法则可以对多个总体均值是否相等进行检验。后者由于通过各组样本资料之间的方差和组内方差的比较来建立服从F分布的检验统计量,所以又称F检验。 第一节:拟合优度检验 第二节:无关联性检验 第三节:方差分析 第四节:回归方程与相关系数的检验

第一节 拟合优度检验 运用Z检验、t检验等讨论假设检验的问题,一般要求总体服从正态分布,或者在大样本条件下可以利用渐近正态分布理论来描述抽样分布。也就是说,我们都要直接或间接地假定对象总体具有已知的分布形式,然后对总体的未知参数进行假设检验。如果不知道总体的分布形式,就无法运用t检验法等对总体参数进行假设检验。于是,这里有一个前面留下来的尚未讨论的问题很重要,就是怎样检定总体是否具有正态或其他分布形式?拟合优度检验正是就这一问题而言的检验方法。

1.问题的导出 第十一章最后一节,我们将累计频数检验用于经验分布与理论分布的比较,实际已经提供了拟合优度检验的一种方 法。 拟合优度检验与累计频数拟合优度检验相对应,在 评估从经验上得到的频数和在一组特定的理论假设下期望得到的频数之间是否存在显著差异时,是一种更普遍的检验方法。 现在我们再来看看第七章提到的著名的孟德尔豌豆试验。根据孟德尔提出的分离规律,纯种豌豆杂交后的子二代出现分化,红花植株与白花植株的数目应为3∶1。但由于随机性,观察结果与3∶1理论值总有些差距。因此有必要去考察某一大小的差距是否已构成否定3∶l理论的充分根据。这正是我们所讨论的拟合优度检验的问题。解决这类问题的工具,是卡·皮尔逊在1900年发表的一篇文章中引进的所谓 检验法。

2.拟合优度检验(比率拟合检验) 首先把问题表述成一般模式。设一总体包含c种可区别的个体。根据某种理论或纯粹的假设,第i种个体出现的概率应为某个已知的数Pi(i=1, 2,…,c),有Pi>0, =1。这一组概率(P1 ,P3 ,…,Pc)就构成 了我们的理论分布。现在在该总体中随机地抽取一个容量为n的样本,发现其中第I 种个体的数目为fi (i=1,2,…,c),并有 =n。我们 要据此检验理论分布。 用概率论的语言可以这样说,设对象总体中随机变量X有c种取值。当X的取值是xi时,按零假设,其总体分布等于理论分布,即 P( )=Pi (i=1,2,…,c) 例如,就孟德尔的3∶1理论来说,c=2,P(x1)=3/4, P(x2)=1/4。现在从该总体中随机地抽取一个容量为n的样本,发现其中xi(i=1,2…,c)出现的次数为fi(i=1,2,…,c),并有 =n。知道了频数也就知 道了频率,即: 出现的频率为 ,并有 =1。 现在我们就是要据此经验分布来检验总体分布等于理论分布的零假设。

拟合优度检验如何进行? 关键是确定合适的检验统计量以及该统计量所服从的概率分布。这里不可避免地要引进某种人为因素,即人们设计出下面这样的综合性可比指标: 其中k1,k2,…,kc是适当选取的常数。仔细观察不难 发现,L值大,意味着经验分布与理论分布偏离大;L值小,意味着经验分布与理论分布偏离小。当在某个选定的水平上,经验分布显著偏离理论分布,那么对象总体具有某种分布形式的零假设便被否定。

结论: 用 作为检定Ho成立的检验统计量,理论证明,当n足够大 时,该统计量 服从 分布,它是一种具有已知的并制成表的概率 时,该统计量 服从 分布,它是一种具有已知的并制成表的概率 分布,因此对给定的显著性水平α,可求得临界值 ,与 比 较,进而作出检验结论。 显而易见,理论频数fe与观测频数fo越接近, 统计值越小,经验 分布与理论分布拟合程度越好。反之,fe与fo差距越大, 值越 大,经验分布与理论分布拟合程度越差,拟合优度检验由此得 名。

应用举例 [例] 孟德尔遗传定律表明:在纯种红花豌豆与白花豌豆杂交后所生的子二代豌豆中,红花对白花之比为3:1。某次种植试验的结果为;红花豌豆176株,白花豌豆48株。试在α=0.05的显著性水平上,对孟德尔定律作拟合优度检验。(参见下表)

[例] 试对下表所给男青年身高分布的数据作正态拟合检验,选取α=0.05。 3.正态拟合检验 [例] 试对下表所给男青年身高分布的数据作正态拟合检验,选取α=0.05。

[解]

第二节 无关联性检验 检验的另一个重要应用是对交互分类资料的独立性检验,即列联表检验。在上一章,我们曾多次提到过性别与收入高低有无关联的问题,在实际中类似的问题很多。例如受教育程度与投票行为有无关联?吸烟与寿命长短有无关联?家庭小孩多少与收入多少有无关联?受教育时间长短与收入多少有无关联?血型与某种性格上的差异有无关联?等等,把这类问题上升到一般,就是在列联表的基础上考察变量X与Y有无关联。由于列联表一般是按品质标志把两个变量的频数进行交互分类的,所以: ① 检验法用于对交互分类资料的独立性检验,有其它方法无法比拟的优点; ②如何求得列联表中的理论频数就成了独立性检验的关键。

1、独立性、理论频数及自由度 应用此式,不必计算理论频数 计算与 这个检验统计量相联系的自由度 计算与 这个检验统计量相联系的自由度 算出 统计量之值并定出其自由度后,就可以依前述的方法,在给定了显著性水平之后,来对X,Y属性无关联的零假设进行检验了。

应用举例 [例] 检验也适用于定类变量和定类变量的相关统计,即可以用它检定λ和τ系数是否显著。就下表所示资料,试以 检验检定性别与收入之间的相关程度是否显著(α取0.001)。

[解]

故拒绝H0,即认为总体上性别与收入高低之间不独立,有显著相关关系。

[例] 在某种流行病流行的时候,共有120个病人进行了治疗,其中40个病人按标准剂量服用某种新药,另有40个病人按标准剂量的2倍服用了这种新药,其余40个病人只按病状治疗(而不是按病因治疗),治疗结果按迅速痊愈、缓慢痊愈、未痊愈分为三类,最后交叉分类的情况列于下表,试问这三种疗法之间有没有差别(α取0.05)。

[解] H0:这三种疗法之间没有差别 H1:这三种疗法之间有差别 由于α=0.05;自由度k=(c―l)(r ―l)=2×2=4,查 分布表得临界值: 在零假设下,计算检验统计量,计算过程参见后表。 因此 > ,故拒绝零假设,即三种疗法之间有显著差别。

第三节 方差分析 方差分析,是一种很重要的分析方法,它可以检验两个以上样本均值之差。方差分析是均值差检验的推广,一般用于处理自变量是一个(或多个)定类变量和因变量是一个定距变量之间的关系。方差分析所包含的假定与均值差检验所包含的假定差不多,例如正态分布、独立随机样本、等方差性等,但检验本身却很不相同。方差分析直接涉及的是方差而不是均值和标准差。同时,比较也不取两种估计量之差,而是取两种估计量的比率。在两种估计量彼此独立的前提下,两种估计量之比率F具有已知的抽样分布,因而可进行很简单的检验。

总变差 :在方差分析中记作SST,它表示 对于总均值 的偏差之平方和。即: SST= 1.总变差及其分解 总变差 :在方差分析中记作SST,它表示 对于总均值 的偏差之平方和。即: SST= 式中: ni是第i个样本的容量, n= 为什么会形成总变差这个散布度呢? 一是三个样本可能不同,这使全部数据 有三个“中心”; 二是随机抽样误差的影响,使数据在每个中心附近有散布。

总变差分解

可以看出,总变差分解成两部分: 第一部分是各观测值 对其所属类别均值 的偏差的平方和,称为组内变差(Within-groups Sum of Squares),记作SSW。组内变差反映了数据围绕各“中心”的散布程度,即反映了 因随机波动所产生的变异,与自变量因素无关。换言之,SSW是自变量因素所没有解释的 的变异。因此,又称之为残差。 第二部分是组间平方和 (Between-groups Sum of Squares),记作SSB ,它涉及到诸类别均值 对总均值 的偏差,反映了前表中数据的c个“中心”的散布程度。

2.关于自由度 弄清了组间变差和组内变差,检验“A1≠A2≠A3”(也就是零假设μ1=μ2=μ3)的思路也就梳理出来了:关键是比较两种变差是否有显著差异。若第一种变差明显大于第二种变差,则认为家庭因素对孩子图书消费是有影响的;若第一种变差与第二种变差之间无显著区别,则不能认为家庭因素对孩子图书消费有影响。但在统计学上,方差分析不取两者之差而取两者之比来进行这种比较。而且,方差分析不是直接用SSB/SSW作为检验统计量,而是用 可以解释的方差/不能解释的方差 作为检验统计量,即:

组间平方和代表c个样本均值对总均值的偏差。也就是每个可看作为一个单位,c个可看作为c个单位,有c个自由度,求用去一个自由度。因而,与组间平方和相联系的自由度为c―1。再看组内平方和,计算时每列失去一个自由度。因而,与组内平方和相联系的自由度为n―c。最后看总平方和,计算总均值时失去一个自由度。因而,与总平方和相联系的自由度为n―l。总的来看有: n―l =(n―c)+(c―1) 总自由度=组内自由度 + 组间自由度

上式是在在零假设(H0:μ1=μ2=…=μc)之下,检验统计量Fo的计算公式。 理论证明:上式服从分子自由度为k1=c―1、分母自由度为k2=(n―c)的F分布。于是,给定显著性水平α,我们就可以很方便地从F分布表中查到临界值Fα(c―1,n―c)。如果出现Fo>Fα的情况,我们将在这个显著性水平上拒绝零假设。在实际运用中,方差分析的结果常用一种称为“方差分析表”的标准形式的表格表示出来,其基本形式如表后所示。

3.关于检验统计量Fo的计算 为了简化检验统计量Fo的计算,有必要将SST 、SSW、SSB这三个定义式展开,其方法与分解总变差的方法相同。于是有: 注意,由于总变差等于另两个变差之和,所以三个变差中仅需求出两个变差。求出组内平方和比求另两个平方和繁琐得多,故通常我们都是从总平方和减去组间平方和来求组内平方和的。

[例] 试对下表中的资料,计算SST 、SSW、SSB ,并检验μ1=μ2=μ3的零假设(α取0.05)。

解:据题意,n1=n2=n3=8,n1+ n2+ n3=24 组内自由度=n―c=24―3=21 组间自由度=c―1=3―1=2 分别计算SST和SSB ,计算过程参见下表。

由于α=0.05,查F分布表得临界值 : Fα(c―1,n―c)=F 0.05 (2,21)=3.47>1.19 故在0.05显著性水平上不否定零假设,即没有充分根据提出这三类家庭的孩子在图书消费方面有显著不同。

[例]研究某种商品销量与品牌的关系,得下表资料,其中A1,A2,A3表示不同的品牌,数据表示销量。试以显著性水平10%判断 品牌对该种商品的销量有无影响。

[解] 据题意,n1=n1+ n2+ n3=2 + 4 +3 = 9 组内自由度=n―c=9―3=6 组间自由度=c―1=3―1=2 分别计算SST和SSB ,计算过程参见前表13.16。 于是得MSB 和 MSW MSB=SSB/(c―1)=6.89/2=3.45 MSW =SSW/(n―c)=30/6=5.00 再根据(13.19)式求检验统计量Fo Fo= = = 0.69 <1 故在0.10显著性水平上不否定零假设,即不能判断不同品脾对该种商品的销量有显著影响。

4.相关比率 当方差分析的检验呈显著性后,进一步讨论两变量间的相关程度是很自然的。方 差分析中相关程度的测定仍采用PRE法。当不知因变量Y 的取值与自变量X 的取值 A1,A2,…,A c有关时,最好的预测是以总均值 作为Y 的估计值。此时,估计所 犯的错误将等于SST E1=SST = 当已知因变量Y 的取值与自变量X 的取值A1,A2,…,A c有关后,自然用各样本的均 值 作为各类别的预测值,此时预测所产生的误差将等于SSW E2=SSW = 所以消减误差比例可写成PRE= = = 正是因为上式,我们把SSB称为已解释的变差。显然,已解释的变差越大,预测Y 所 减少的误差就越多,X与Y 之间的关系就越密切。据此,方差分析中把已解释的变差 对总变差的比值称为相关比率,用符号 表示 =1― = 可用于一个定类变量与一个定距变量的相关程度的测定,当然也可以用于定序— 定距变量或定距—定距变量的相关程度的测定。

[例] 试以表13.12的资料,分析孩子图书消费与家庭类型的关系。 解: 据前面例题中已计算的结果,已知SSB=28,SST=276,因而有 =1― = = =10.1% 可见,就表给资料而言,利用家庭类型预测孩子图书消费量,只能削减10.1%的预测误差。

小结: 相关比率 研究的是定类—定距变量之间的相关程度。由于定类变量不具有数量大小的问题,不存在关系是否线性的问题。因此,当 被用于研究定距—定距变量之间的关系时,不仅可以作为线性相关的量度,也可以作为非线性相关的量度。这意味着,对线性相关,相关比率 与r2(积差系数之平方)有相同的PRE性质;但如果对非线性相关,用积差系数r 来讨论就不行了。 对于定距—定距变量,曲线相关既然要用R来测量,那么反过来,同一资料通过相关指数R与积差系数r计算的比较,可以判断确定两定距变量的关系是不是直线。如果同时求出r与R,r 等于或略大于R,可说明两变量关系是直线的,用r去测量是合适的;如果r<R,则说明两变量关系可能是曲线的。

5.关于方差分析的几点讨论 首先 ,MSB和MSW可以分别称为组间方差和组内方差,其中(在等方差的假设下)组内方差总是σ2的无偏估计;而组间方差,只有当诸总体(即各样本所代表的子总体)均值实际上相等时,它才是σ2的无偏估计。这就是说,如果零假设为真,MSB和MSW之间将没有太大的差别。反之。如果零假设实际不正确,可以期望MSB和MSW的比值大于1。如果这个比值小于1,则不从F分布表中查找临界值Fα就可以判断零假设不能被否定。 其次,以上两个例题也可以用均值差检验来处理。均值差检验涉及t分布,可以做三组合的比较.即A1与A2,A2与A3,A1与A3。与均值差检验不同,方差分析仅进行一次检验来判定三种类别的家庭(或品牌)在消费(或销售)上彼此是否有显著性差异。方差分析的优点在于,一个检验可以代替多个检验。如果有四个类别,均值差检验需做(4×3)/2=6次;如果有六个类别,需做(6×5)/2=15次;如果有十个类别,需做(10×9)/2=45次。况且,如果做15次均值差检验。其中4次结果具有显著性,这时应当下什么结论?可能很难回答。

第三,方差分析中的自变量X如果是二分变量,也可以采用均值差t检验。在这种情况下,F 的分子自由度是2―1=1,分母自由度是n―2,这与均值差检验中的t相同。经过计算可知,具有自由度n―2的t 2值等于具有分子自由度为1和分母自由度为n―2的F 值。比较F 表和t 表也可以核实这一点。换言之,t是分子自由度为l的F 的平方根。这当然意味着,对于样本而言,此时不论采用方差分析或均值差检验,其结果完全相同。 第四,本节集中讨论了自变量为一个定类变量而因变量为一个定距变量的情况。如果对因变量Y影响的自变量由一个变为两个以上,我们就将面对多元方差分析了。总变差分解的思想可以直接推广至多因素显著性检验。例如就两个自变量(A和B)独立对因变量Y 影响的情况,可以得到下述方差分析表(表13.17)。

第四节 回归方程与相关系数的检验 相关与回归,由于其广泛应用,如今在统计学中是高度发 展的分支之一。而从实用的观点来看,线性关系是最简单也 第四节 回归方程与相关系数的检验 相关与回归,由于其广泛应用,如今在统计学中是高度发 展的分支之一。而从实用的观点来看,线性关系是最简单也 是最重要的一种关系。本书第十二章已经对积差系数与回归 直线作了比较细致的讨论。但有关假设检验的内容,由于要 借助于推论统计的知识方能阐明,所以本书将这部分内容集 中放到这一节来加以补充。学过推论统计的人要克制自己免 受直线的诱惑,对此,讨论回归系数和积差系数之假设检验 将具有重要意义。

1.回归系数的检验 E0= = SST 检验两个总体变量(定距—定距变量)是否具有线性关系,主要检验总体的回 归系数B是否等于零。因此,对于总体线性检验的假设可写成如下形式: H0:B=0 H1:B≠0 为了寻求检验H0的方法,我们需要对离差平方和进行分解。而这项工作, 前面已经完成。我们发现,估计Y,当不知Y和X的关系时,对它的最佳估计 值只能是 。离差之平方和(总变差),正是不知Y 和X 的关系时,估计Y 的全部误差E0 E0= = SST

做了回归预测之后.我们可以用Yc估计Y (参见下图)。这时 估计Y 的误差变为E1(剩余变差): E1= = SSW

Fo= ~ F(1,n―2) 显然,利用Yc去估计Y 比用去 估计Y 要消减一些误差。 消减的误差E0―E1就是被回归直线解释掉的误差(回归变差). 从第十二章已经讨论过的回归变差和剩余变差的意义来看,一个回归方程效果的好坏,取决于它们两者之间的比 较。已解释的回归变差越大,用Yc去估计Y 比用去 估计 Y 消减的误差就越多,回归预测的效果也就越好。依此, 并按上一节方差分析的思想,在H0成立的条件下,检验回归直线的统计量可构造为 E0―E1= Fo= ~ F(1,n―2)

自由度问题 因回归变差中仅含一个自变量X,故自由度为l。而总变差所含自由度为(n―1),从而由总自由度=组内自由度+组间自由度,得剩余变差的自由度为(n―2)。 对选定显著性水平α,可查表得临界值Fα。若出现Fo>Fα(1,n―2)的情况,则拒绝H0,即认为回归方程中X变量对Y的解释力是显著的;若出现Fo<Fα(1,n―2)的情况,则不能拒绝H0,即认为回归方程中X 变量对Y 没有的显著的解释力。

[例] 对[例12.5.1]所建立的回归方程进行回归直线的检验(α取0.05)。

[解] 根据表12.22和[例12.5.1]的计算结果可知: =48, =252, =52.5, =299.75, =268.5 [解] 根据表12.22和[例12.5.1]的计算结果可知: =48, =252, =52.5, =299.75, =268.5 a=0.475,b=0.975,n=12 = =299.75―0.475×52.5―0.975×268.5 =13.02 =(0.975)2×[252― ] =57.04

计算检验统计量 Fo= = =43.81 对α=0.05,查F 表得临界值 Fα(1,n―2)=F0.05 (1,10)=4.96≪43.81 所以拒绝H0,即可以认为对总体配置回归直线是有意义的。

2.积差系数的检验 对于定距—定距变量,上一章讨论的积差系数是就样本而言的。如同 样本均值、成数不能完全代表总体均值、成数一样,样本积差系数r 也 不就是总体积差系数ρ。但在社会研究中,要想确切了解两总体变量 (定距— 定距变量)间的积差系数是很困难的。所以,通常需要通过样本积差系数的统计检验来认识总体的积差系数ρ。 设有两变量X 和Y,它们的积差系数记为ρ。当ρ=0时,表示X和Y不 具有线性相关关系,当ρ≠0时,表示X和Y 具有线性相关关系。 实践证明,样本积差系数r 值比较大时,并不等于总体积差系数ρ也 比较大。尤其是样本中所含观测值较少时,更可能出现这种情况。例 如,当X与Y各只有两个样本数据时,积差系数总是为1,但显然这不 能说明变量间一定完全相关。也就是说,有时即使样本积差系数很 大,也并不一定就表明总体积差系数ρ也一定很大。总体积差系数ρ 的情况,只有在对样本积差系数进行统计显著性检验后,才能得出结论。

那么判断线性相关的“显著”与“不显著”的检验统计量如何构造呢? 统计理论证明,样本积差系数是总体积差系数的一个无偏估 计量,有: =ρ, =

to=r ~ t(n―2) 而且当ρ=0时,样本容量越大,r(显然为一随机变量)的 抽样分布越接近于自由度为n―2的t分布(见前图)。因而 有检验统计量 : to=r ~ t(n―2) 积差系数检验的假设为: H0:ρ=0 (两总体不具有线性相关关系) H1:ρ≠0 (两总体具有线性相关关系) 对选定的显著性水平α,查t分布表得临界值tα/2(n―2),与统计值to作比较。 若 > ,则表明r在统计上是显著的,即总体积差系数显著地不同于零; 若 < ,则说明r在统计上不显著,即X与Y间并不存在线性相关关系。

例: [例12.4.1]已对表12.21所示资料求出积差系数,试在0.05显著性水平上作总体相关检验。 例: [例12.4.1]已对表12.21所示资料求出积差系数,试在0.05显著性水平上作总体相关检验。 表12.21

故拒绝H0,接受H1,即认为员工的工龄和技术考核分之 间存在线性相关。 但是,为了使用者的方便,上述检验现已简化为使用相关系数r进行直接 [解] 建立假设 H0:ρ=0 H1:ρ≠0 已知r=0.902,n=12,于是得 to=r =0.902× =6.608 对α=0.05,查表得临界值 t α/ 2(n―2)=t0。025(10)=2.228<6.608 故拒绝H0,接受H1,即认为员工的工龄和技术考核分之 间存在线性相关。 但是,为了使用者的方便,上述检验现已简化为使用相关系数r进行直接 检验。附表12是以r的抽样分布编制的相关系数表,只要给出显著性水平 α和自由度k=n―2,便可以在表中直接查出相应的临界值rα(n―2)。

例: 用附表12直接对上例进行积差系数检验。 [解] 已知r=0.902,n=12,对α=0.05,k=12―2=10,从附表12中查得 例: 用附表12直接对上例进行积差系数检验。 [解] 已知r=0.902,n=12,对α=0.05,k=12―2=10,从附表12中查得 rα(n―2)=rα(10)=0.576<0.902 故拒绝零假设,即在0.05显著性水平上可以认为员工的 工龄和技术考核分之间存在线性相关。

小结: 上一小节,我们讲的是回归系数的检验,实际上那只是线性回归方程 的检验。而这一小节讨论积差系数的检验,也是要确认总体线性相 关的存在。因而假设H0:B=0与假设H0:ρ=0等价。也就是说,如 果样本积差系数r 通过了检验(t 检验),也必然导致回归系数b能通过 检验(F检验)。实际上F公式与t 公式是有对应关系的。 Fo= = =t 2 即具有自由度n―2的 t 2值等于具有分子自由度1和分母自由度n―2的 F 值。也正是由于这个原因,有的教科书就是用t 统计量来检验回归 假设的。而如果有了r 检验表(附表12),问题就变得更为简单,计算 Fo值并进行F 检验也都不必要了。

3.回归方程的区间估计 估计Y 当不知Y 和X 有关系时,对它的最佳估计值只能是 ,估 计的全部误差是 ; 计的全部误差是 ; 当知道Y 和X 有关系时,可以改用Yc 来估计Y,此时估计的误差减少为 。 当知道Y和X有关系后,用Yc来估计Y固然可以消减不少估计 误差,这也不过是点估计。而如果我们能在拟合值Yc上下设 置一个合适区间,那么Y被估计到的可能性便会大大增加。 回归方程区间估计提出的背景

在回归线两侧设置一个估计区间总是容易做到的,但问题是 我们需要对估计的信度和效度作通盘考虑。为此,我们必须 了解Y在Yc两侧的分布特征以及Y在Yc两侧的分散程度。

1)Y 的实际观测值在对应的每个估计值Yc周围都是正态分布,越靠近Yc 的地方,Y值出现的机会越多,反之出现的机会越少; 由于误差为正态分布的原理(即中心极限定理),当样本容量n大于30 时,我们可以作如下假定(参见前图): 1)Y 的实际观测值在对应的每个估计值Yc周围都是正态分布,越靠近Yc 的地方,Y值出现的机会越多,反之出现的机会越少; 2)所有正态分布都具有相同的标准差,即所谓的同方差性。 于是,除了重温过去的知识,只有一个具体问题要解决:为了测定 回归线的代表性,有必要参照标准差的意义,引进一个离中趋势的量 度——估计标准误差,记作SY/X ,用来反映围绕回归线的Y值的离散程 度。在这里,求算估计标准误差具有第九章中求算抽样平均误差同样的 意义。

当知道Y和X有关系时,用Yc 来估计Y,估计的误差为剩余 变差 ,即SSW。所以,估计标准误差显然为剩 余方差MSW的平方根,即 SY/X= 直接采用上式来计算估计标准误差比较麻烦,实际计算时,一般用下式(前面已经证明)

[例] 就表12.21所示资料,在[例12.5.1] 的基础上,根据员工的工龄和技术考核分所建立的回归直线方程,求算估计标准误差。 [解] 就表12.21所示资料,在[例12.5.1] 的基础上,参照[例l3.4.1]的计算结果,已知 = =13.02 SY/X= = =1.14 所以,用回归线=0.475 + 0.975X估计因变量Y时的估计标准误差为1.14(分)。

有了估计标准误差,再结合回归方程,就可以对因变量Y进 行估计和推断了。具体来说,就是建立回归估计的置信区间 (参见第九章“区间估计”一节),借以确定回归方程预测或控 制Y的范围。现在根据上述两个假定,并参见第七章图7.6, 的取值或预测区间可以这样期望:

(1)取 ±1SY/X ,那么在散点图上约有68.26%的观测点落在其间(参见图13.3)。

[例] 试以表12.21中的资料为例,说明回归置信区间建立的方法。 [解] 根据[例12.5.1]和上例计算的结果,已知 =0.475 + 0.975X SY/X=1.14 假定自变量工龄X为5(年),得技术考核分的拟合值 =0.475 + 0.975×5=5.35 那么 +1SY/X =5.35 + 1.14=6.49 ―1SY/X =5.35―1.14=4.21 即对工龄为5年的员工,他们的技术考核分在4.21分至6.49分之间的 概率为68.26%。 +2SY/X =5.35 + 2×1.14=7.63 ―2SY/X=5.35―2×1.14=3.07 即对工龄为5年的员工,他们的技术考核分在3.07分至7.63分之间的概率为95.46%。