方差分析 方差分析的概念 单因素方差分析 有交互作用的双因素方差分析 无交互作用的双因素方差分析
1 方差分析的概念 一、问题的引入 在实际应用中,我们常常会遇到需要对两个以及两个以上总体均值是否相等进行检验,从而判断某一种因素对我们所研究的对象是否产生了显著的影响。 方差分析:在若干个能够相互比较的资料组中,判别各组资料是否存在差异以及分析差异原因的方法和技术。
该饮料在五家超市的销售情况 超市 无色 粉色 橘黄色 绿色 例:某饮料生产企业研制出一种新型饮料。饮料的颜色共有四种,分别为橘黄色、粉色、绿色和无色透明。这四种饮料的营养含量、味道、价格、包装等可能影响销售量的因素全部相同。现从地理位置相似、经营规模相仿的五家超级市场上收集了前一时期该饮料的销售情况,见下表,试分析饮料的颜色是否对销售量产生影响。 该饮料在五家超市的销售情况 超市 无色 粉色 橘黄色 绿色 1 2 3 4 5 26.5 28.7 25.1 29.1 27.2 31.2 28.3 30.8 27.9 29.6 28.5 24.2 32.4 31.7 32.8
二、基本概念 1.因素又称因子,指所要检验的对象。是在实验中或在抽样时发生的“量”,通常用A、B、C……表示。 可以控制的试验条件 二、基本概念 1.因素又称因子,指所要检验的对象。是在实验中或在抽样时发生的“量”,通常用A、B、C……表示。 如:要分析饮料的颜色对销售量是否有影响,颜色是要检验的因素或因子. 单因素方差分析:在实验中变化的因素只有一个。 多因素方差分析:在实验中变化的因素不只有一个。
2.水平:因子在实验中的不同状态或因素的具体表现称为水平。上例中A1、A2、A3、 A4四种颜色就是因素的水平。 3.交互影响:如果因子间存在相互作用,称之为“交互影响”;如果因子间是相互独立的,则称为无交互影响。 4.观察值:在每个因素水平下得到的样本值。 上例中每种颜色饮料的销售量就是观察值。
5.总体:因素的每一个水平可以看作是一个总体。 上例中A1、A2、A3、 A4四种颜色可以看作是四个总体。 6.样本数据:上面的数据可以看作是从这四个总体中抽取的样本数据。
三、方差分析的基本思想 比较两类误差 以检验均值是否相等 随机误差和系统误差 比较两类误差 以检验均值是否相等 随机误差和系统误差 随机误差:在因素的同一水平(同一个总体)下,样本的各观察值之间的差异。 比如,同一种颜色的饮料在不同超市上的销售量是不同的。不同超市销售量的差异可以看成是随机因素的影响,或者说是由于抽样的随机性所造成的,称为随机误差 。
系统误差:在因素的不同水平(不同总体)下,各观察值之间的差异。 比如,同一家超市,不同颜色饮料的销售量也是不同的。这种差异可能是由于抽样的随机性所造成的,也可能是由于颜色本身所造成的,后者所形成的误差是由系统性因素造成的,称为系统误差。 比较的基础是方差比 组内方差、组间方差 组内方差:因素的同一水平(同一个总体)下样本数据的方差。 比如,无色饮料A1在5家超市销售数量的方差。组内方差只包含随机误差
组间方差:因素的不同水平(不同总体)下各样本之间的方差 比如,A1、A2、A3、A4四种颜色饮料销售量之间的方差。组间方差既包括随机误差,也包括系统误差。 方差的比较 如果不同颜色(水平)对销售量(结果)没有影响,那么在组间方差中只包含有随机误差,而没有系统误差。这时,组间方差与组内方差就应该很接近,两个方差的比值就会接近1。
如果不同的水平对结果有影响,在组间方差中除了包含随机误差外,还会包含有系统误差,这时组间方差就会大于组内方差,组间方差与组内方差的比值就会大于1。 当这个比值大到某种程度时,就可以说不同水平之间存在着显著差异。
四、基本假定 1.每个总体都应服从正态分布 对于因素的每一个水平,其观察值是来自服从正态分布总体的简单随机样本 比如,每种颜色饮料的销售量必须服从正态分布 2.各个总体的方差必须相同 对于各组观察数据,是从具有相同方差的总体中抽取的。 比如,四种颜色饮料的销售量的方差都相同。 观察值是独立的。 比如,每个超市的销售量都与其他超市的销售量独立。
五、方差分析的原理 在上述假定条件下,判断颜色对销售量是否有显著影响,实际上也就是检验具有同方差的四个正态总体的均值是否相等的问题。 如果四个总体的均值相等,可以期望四个样本的均值也会很接近。 四个样本的均值越接近,我们推断四个总体均值相等的证据也就越充分。 样本均值越不同,我们推断总体均值不同的证据就越充分。
这意味着每个样本都来自均值为、方差为2的同一正态总体 如果原假设成立,即H0: 1 = 2 = 3 = 4 四种颜色饮料销售的均值都相等 没有系统误差 这意味着每个样本都来自均值为、方差为2的同一正态总体 X f(X) 1 2 3 4
如果备择假设成立,即H1: i (i=1,2,3,4)不全相等 至少有一个总体的均值是不同的 有系统误差 这意味着四个样本分别来自均值不同的四个正态总体 。 X f(X) 3 1 2 4
六、方差的分解 样本数据的波动有两个来源:一个是随机波动;一个是因子影响。样本数据的波动,可通过离差平方和来反映。这个离差平方和可分解为组间方差与组内方差两部份。即 总离差平方和=组间离差平方和+组内离差平方和 组间方差反映出不同的因子对样本波动的影响;组内方差则是不考虑组间方差的纯随机影响。 如果组间方差明显高于组内方差,说明样本数据波动的主要来源是组间方差,因子是引起波动的主要原因,可认为因子对实验的结果存在显著的影响; 反之,如果波动的主要部分来自组内方差,则因子的影响就不明显,没有充足理由认为因子对实验或抽样的结果有显著作用。
七、检验统计量 1、自由度:产生方差的独立变量的个数,称做自由度。 2、均方差:方差除以独立变量个数即自由度。 3、检验因子影响是否显著的统计量. F统计量越大,越说明组间方差是主要的方差来源,因子影响是显著的;F越小,越说明随机方差是主要的方差来源,因子的影响不显著。
第二节 单因素方差分析 一、单因素方差分析的步骤 二、单因素方差分析中的其它问题
单因素方差分析的步骤 (一)提出假设 (二)构造检验统计量 (三)统计决策
(一)提出假设 一般提法 H0: 1 = 2 =…= r (因素有r个水平) H1: 1 , 2 ,… , r不全相等 对前面的例子提出假设 H0: 1 = 2 = 3 = 4(颜色对销售量没有影响) H0: 1 , 2 , 3, 4不全相等(颜色对销售量有影响) (二)构造检验统计量 为检验H0是否成立,需确定检验的统计量 —F统计量
总离差平方和=组内离差平方和+组间离差平方和 构造检验统计量需要计算 1、水平的均值 2、全部观察值的总均值 3、离差平方和 4、均方(MS) 总离差平方和=组内离差平方和+组间离差平方和 离差平方和:SST= SSE + SSA 自由度: nr-1 = (nr-r) + ( r-1 ) 均方差: MST= MSE + MSA
SST是全部观察值 与总平均值的离差平方和,反映全部观察值的离散状况。 其计算公式为: SST反映了全部数据总的误差程度。 SSA(组间离差平方和) SSA既包括随机误差,也包括系统误差,反映的是随机误差和系统误差的大小。
如果原假设成立,即H1= H2 =…= Hr为真,则表明没有系统误差。 组间平方和SSA除以自由度后的均方差与组内平方和SSE除以自由度后的均方差的差异就不会太大; 如果组间均方差显著地大于组内均方差,说明各水平(总体)之间的差异不仅有随机误差,还有系统误差。 判断因素的水平是否对其观察值有影响,实际上就是比较组间均方差与组内均方差之间差异的大小。 检验这种差异,需要构造一个用于检验的统计量。 检验统计量=组间均方差/组内均方差 即:F=MSA/MSE
计算均方差MS 各离差平方和的大小与观察值的多少有关,为了消除观察值多少对离差平方和大小的影响,需要用离差平方和除以相应的自由度,这就是均方差。 计算方法: MST=SST/nr-1 MSA=SSA/r-1 MSE=SSE/nr-r 统计决策 将检验统计量的值F与给定的显著性水平的临界值F进行比较,作出接受或拒绝原假设H0的决策。
检验规则 若F>F ,则拒绝原假设H0 ,表明均值之间的差异是显著的,所检验的因素(A)对观察值有显著影响。 拒绝域 接受域
单因素方差分析表 方差来源 平方和SS 自由度 df 均方 MS F 值 组间(因素影响) 组内(误差) 总和 SSA SSE SST r-1 nr-r nr-1 MSA MSE MSA/MSE
例:为了对几个行业的服务质量进行评价,消费者协会在零售业、旅游业、航空公司、家电制造业分别抽取了不同的样本,其中零售业抽取7家,旅游业抽取了6家,航空公司抽取5家、家电制造业抽取了5家,然后记录了一年中消费者对总共23家服务企业投诉的次数,结果如表9.7。试分析这四个行业的服务质量是否有显著差异?(=0.05)
消费者对四个行业的投诉次数 观察值 ( j ) 行业( A ) 零售业 旅游业 航空公司 家电制造业 1 2 3 4 5 6 7 57 55 46 45 54 53 47 62 49 60 56 51 48 70 68 63 69
解:设四个行业被投诉次数的均值分别为, 1、 2 、 3、 4 ,则需要检验如下假设 H0: 1 = 2 = 3 = 4 (四个行业的服务质量无显著差异) H1: 1 , 2 , 3, 4不全相等 (有显著差异) Excel输出的结果如下 结论:拒绝H0,即四个行业的服务质量有显著差异。
二、单因素方差分析中的其它问题 F值显著或极显著,否定了无效假设HO ,表明试验的总变异主要来源于处理间的变异,试验中各处理平均数间存在显著或极显著差异,但并不意味着每两个处理平均数间的差异都显著或极显著,也不能具体说明哪些处理平均数间有显著或极显著差异,哪些差异不显著。
因而,有必要进行两两处理平均数间的比较,以具体判断两两处理平均数间的差异显著性。 统计上把多个平均数两两间的相互比较称为多重比较(multiple comparisons)。 多重比较的方法甚多,常用的有最小显著差数法(LSD法)和 最小显著极差法(LSR法),现分别介绍如下。
(一)最小显著差数法 (LSD法,least significant difference)
若 >LSDα时,则 与 在α水平上差异显著;反之,则在α水平上差异不显著。最小显著差数由下式计算。 式中: 为在F检验中误差自由度下,显著水平为α的临界t值, 为 均 数差异标准误,由下式算得。
其中 为F检验中的误差均方,n为各处理的重复数。 当显著水平α=0.05和0.01时,从t值表中查出 和 ,代入 得: 利用LSD法进行多重比较时,可按如下步骤进行: (1) 列出平均数的多重比较表 比较表中各处理按其平均数从大到小自上而下排列;
(2)计算最小显著差数 和 ; (3)将平均数多重比较表中两两平均数的差数与 、 比较,作出统计推断。 (2)计算最小显著差数 和 ; (3)将平均数多重比较表中两两平均数的差数与 、 比较,作出统计推断。
关于LSD 法的应用有以下几点说明: 1、 LSD 法实质上就是t检验法。它是将 t 检验中由所求得的t之绝对值 与临界ta值的比较转为将各对均数差值的绝对值 与最小显著差数 的 比较而作出统计推断的 。 但是,由于LSD法是利用F检验中的误差自由度 df e 查 临界tα值,利用误差均 方 计 算 均 数 差 异 标 准误 , 因而法又不同于每次利用两组数据进行多个 平 均 数 两 两 比较的检验法 。
2、有人提出, 与检验任何两个均数间的差异相 比较,LSD法适用于各处理组与对照组比较而处理组间不进行比较的比较形式。实际上关于这种形式的比较更适用的方法有顿纳特(Dunnett)法 (关于此法,读者可参阅其它有关统计书籍)。
3、因为LSD法实质上是t检验,故有人指出其最适宜的比较形式是:在进行试验设计时就确定各处理只是固定的两个两个相比,每个处理平均数在比较中只比较一次。例如,在一个试验中共有4个处理, 设 计 时 已 确 定 只是处理1与处理2、处理3与处理4(或1与3、2与4;或1与4、2与3)比较, 而 其它的处理间不进行比较。因为这种比较形式实际上不涉及多个均数的极差问题,所以不会增大犯I型错误的概率。
综上所述,对于多个处理平均数所有可能的两两比较,LSD法的优点在于方法比较简便,克服一般检验法所具有的某些缺点,但是由于没有考虑相互比较的处理平均数依数值大小排列上的秩次,故仍有推断可靠性低、犯I型错误概率增大的问题。为克服此弊病,统计学家提出了最小显著极差法。
(二)最小显著极差法 (LSR法 ,Least significant ranges) LSR法的特点是把平均数的差数看成是平均数的极差, 根据极差范围内所包含的处理数(称为秩次距)k的不同而采用不同的检验尺度,以克服LSD法的不足。这些在显著水平α上依秩次距k的不同而采用的不同的检验尺度叫做 最小显著极差LSR。
例如有10个 要相互比较, 先将10个 依其数值大小顺次排列, 两 极 端平均数的差数(极差)的显著性,由 其 差 数 是 否 大于秩次距k=10时的最小显著极差决定 (≥为显著,<为不显著);而后是秩次距 k=9 的平均数的极差的显著性,则由极差是否大于k=9 时 的最小显著极差决定;……直到任何两个相邻平均数的差数的显著性由这些差数是否大于秩次距 k=2 时的最小显著极差决定为止。因此,有 k个平均数相互比较,就有 k-1 种秩次距 (k , k-1 ,k-2,…,2),因而需求得k-1个最小显著极差(LSRα,k) ,分别作为判断具有相应秩次距的平均数的极差是否显著的标准。
因为LSR法是一种极差检验法 , 所以当一个平均数大集合的极差不显著时,其中所包含的各个较小集合极差也应一概作不显著处理。 LSR法克服了LSD法的不足 ,但检验的工作量有所增加。常用的LSR法有q检验法和新复极差法两种。 1、q检验法(q test) 此法是以统计量q的概率分布为基础的。q值由下式求得: (6-20)
式中,ω为极差, 为标准误,分布依赖于误差自由度dfe及秩次距k。 利用q检验法进行多重比较时 , 为了简便起见,不是将由(6-20)式算出的q值与临界q值 比较,而是将极差与 比较,从而作出统计推断。 即为α水平上的最小显著极差。
(6-21) 当显著水平α=0.05和0.01时, 从 附 表5(q值表)中根据自由度 及 秩 次 距 k 查出 和 代入(6-21)式得 (6-22) 实际利用q检验法进行多重比较时,可按如下步骤进行:
(1)列出平均数多重比较表; (2)由自由度dfe、秩次距k查临界q值,计算最小显著极差LSR0.05,k,LSR0.01,k; (3)将平均数多重比较表中的各极差与相应的最小显著极差LSR0.05,k, LSR0.01,k比较,作出统计推断。
2、新复极差法(new multiple range method) 此法是由邓肯 (Duncan) 于1955年提出,故又称Duncan法,此法还称SSR法(shortest significant ranges)。 新复极差法与q检验法的检验步骤相同,唯一不同的是计算最小显著极差时需查SSR表(附表6)而不是查q值表。最小显著极差计算公式为 (6-23)
其中是根据显著水平α、误差自由度dfe、秩次距k,由SSR表查得的临界SSR, 。α=0. 05 和 α=0 (6-24) 对于【例6.1】,各处理均数多重比较表同表6-4。 已算出 =1.033,依dfe=16 k=2,3,4,由附表6查临界SSR0.05(16,k)和SSR0.01(16,k)值,乘以 =1.033,求得各最小显著极差,所得结果列于表6-6。
将表6-4中的平均数差数(极差)与表6-6中的最小显著极差比较,检验结果与 q检验法 相同。 当各处理重复数不等时,为简便起见,不论LSD法还是LSR法,可用(6-25)式计算出一个各处理平均的重复数n0,以代替计算 或 所需的n。 (6-25) 式中k为试验的处理数, (i=1,2,…,k)为第i处理的重复数。
以上介绍的三种多重比较方法,其检验尺度有如下关系: LSD 法≤新复极差法≤q检验法 当秩次距k=2时,取等号; 秩次距 k ≥3时,取小于号。在多重比较中,LSD法的尺度最小,q检验法尺度最大,新复极差法尺度居中。用 上述排列顺序前面方 法 检 验 显 著 的 差 数 ,用 后 面 方 法 检 验 未 必 显著;用后面 方 法 检 验 显 著 的 差 数 , 用 前 面 方 法 检 验必 然 显 著 。 一 般 地 讲 ,一 个
试验资料,究竟采用哪一种多重比较方法,主要应根据否定一个正确的 H0 和接受一个不正确的H0的相对重要性来决定。如果否定正确的 H0是事关重大或后果严重的,或对试验要求严格时,用检验法较为妥当 ;如果接受一个不正确的H0是事关重大或后果严重的,则宜用新复极差法。 生物试验中,由于试验误差较大,常采用新复极差法;F检验显著后,为了简便 , 也 可采用LSD法。
(三)多重比较结果的表示法 各平均数经多重比较后,应以简明的形式将结果表示出来,常用的表示方法有以下两种。 1、三角形法 此法是将多重比较结果直接标记在平均数多重比较表上,如表6-4所示。此法的优点是简便直观,缺点是占的篇幅较大。 2、标记字母法 此法是先将各处理平均数由大到小自上而下排列 ; 然后在最大平均数后标记字母, 并 将 该 平 均数与 以 下 各 平 均 数依次相比,凡 差 异 不 显著标 记 同 一 字 母 ,直到某一个与其差异显著的平均数标记字母b ;
再以标有字母b的平均数为标准 ,与上方比它大的各个平均数比较,凡差异不显著一律再加标b ,直至显著为止; 再以标记有字母 b的最大平均数为标准,与下面各未标记字母的平均数相比,凡差异不显著,继续标记字母b,直至某一个与其差异显著的平均数标记c;……; 如此重复下去,直至最小一个平均数被标记、比较完毕为止。这样,各平均数间凡有一个相同字母的即为差异不显著,凡无相同字母的即为差异显著。 用小写拉丁字母表示显著水平 α=0.05 ,用大写拉丁字母表示显著水平α=0.01。 在利用字母标记法表示多重比较结果时,常在三角形法的基础上进行。此法的优点是占篇幅小,在科技文献中常见。
第三节 有交互作用的双因素方差分析 两因素试验资料的方差分析是指对试验指标同时受到两个试验因素作用的试验资料的方差分析。
离差平方和分解形式: SST=SSA+SSB+SSAB+SSE
离差平方和SST、SSA、SSB、SSAB和SSE的自由度分别是rnm-1、r-1、n-1、(r-1)(n-1)和rn(m-1)。 相应的均方差是
检验因素A与B影响是否显著的统计量分别是 : 检验交互影响是否显著的统计量度是:
第四节 无交互作用的双因素方差分析
数据的离差平方和分解形式为: SST=SSA+SSB+SSE
SSA表示的是因素A的组间方差总和,SSB是因素B的组间方差总和,都是各因素在不同水平下各自均值差异引起的;SSE仍是组内方差部分,由随机误差产生。各个方差的自由度是:SST的自由度为nr-1,SSA的自由度为r-1,SSB的自由度为n-1,SSE的自由度为nr-r-n-1=(r-1)(n-1)。
各个方差对应的均方差是: 对因素A而言: 对因素B而言: 对随机误差项而言:
我们得到检验因素A与B影响是否显著的统计量分别是: