Download presentation
Presentation is loading. Please wait.
1
方差分析
2
第一节 概述 因素(因子)—— 可以控制的试验条件 因素的水平 —— 因素所处的状态或等级
第一节 概述 因素(因子)—— 可以控制的试验条件 因素的水平 —— 因素所处的状态或等级 单(双)因素方差分析——讨论一个(两个)因素对试验结果有没有显著影响。
3
例如:某厂对某种晴棉漂白工艺中酸液浓度(g/k)进行试验,以观察酸液浓度对汗布冲击强力有无显著影响。
序号 冲击强力 浓度 A A A 方差分析就是把总的 试验数据的波动分成 1、反映因素水平改变引起的波动。 2、反映随机因素所引起的波动。 然后加以比较进行统 计判断,得出结论。
4
1、完全随机设计资料的方差分析(单因素方差分析) 2、随机区组设计资料的方差分析(二因素方差分析)
方差分析的基本思想:把全部数据关于总均值的离差平方和分解成几部分,每一部分表示某因素诸水平交互作用所产生的效应,将各部分均方与误差均方相比较,从而确认或否认某些因素或交互作用的重要性。 用公式概括为: 总变异=组间变异+组内变异 各因素引起 由个体差异引起(误差) 种类:常用方差分析法有以下4种 1、完全随机设计资料的方差分析(单因素方差分析) 2、随机区组设计资料的方差分析(二因素方差分析) 3、拉丁方设计资料的方差分析(三因素方差分析) 4、R*C析因设计资料的方差分析(有交互因素方差分析)
5
例:前例题 1、对数据的简化 得下表: 序号 冲击强力 浓度 A A A 由表中数据可算出
6
计算 计算出F值:
7
列表: 方差来源 离差平方和 自由度 F值 F F 显著性 因素A **(十分显著) 试验误差 总误差 说明: ,说明酸液浓度对汗布冲击强力有十分显著的影响。
8
第三节 双因素方差分析 例如:某厂对生产的高速钢铣刀进行淬火工艺试验,考察回火温度A和淬火温度B两个因素对强度的影响。今对两个因素各3个水平进行试验,得平均硬度见表: Bj 试验结果 B1(1210‘C)B2(1235’C)B3(1250‘C) Ai A1(280’C) A2(300‘C) A3(320’C) 假设:美中不足组合水平下服从正态分布、互相独立、方差相等。 所需要解决的问题是:所有Xij的均值是否相等。
9
方差分析表: 方差来源 离差平方和 自由度 F值 F0.05(2,4) F0.01(2,4) 显著性 因素A FA= 因素B FB= * 试验误差 总误差 A影响不显著。 B影响显著,由于 高速钢洗刀的硬度越大越好,因此因素B可取B3水平,即淬火温度1250‘C为好,因素A水平的确定,应考虑经济方便,取A1水平为好。
10
SAS系统中区分两种情况: 1、每组观测数据相等,可用ANOVA过程处理以上四种情形的方差分析。 2、若每组观测数据不相等,可用GLM过程处理以上四种情形的方差分析。
11
均衡数据的方差分析(ANOVA过程) 过程说明: 1、PROC ANOVA; 可以是数值型和字符型 2、CLASS 变量表;
3、MODEL 因变量表=效应; 4、MEANS 效应[/选择项]; 5、ALPHA=p 显著性水平(缺省值为0.05) 可以是数值型和字符型 CLASS和MODEL是必需的, CLASS必须的MODEL之前。 输出因变量均数,对主效应均数间的检验。 是指因变量与自变量效应,模型如下: 1、主效应模型 MODEL y=a b c; (a b c是主效应,y是因变量) 2、交互模型 MODEL y=a b c a*b a*c b*c a*b*c; 3、嵌套效应 MODEL y=a b c(a b); 4、混合效应模型号 MODEL y=a b(a) c(a) b*c(a);
12
例:1、单因素方差分析 某劳动卫生组织研究棉布、府绸、的确凉、尼龙四种衣料内棉花吸附十硼氢量。每种衣料做五次测量,所得数据如下。试检验各种衣料见棉花吸附十硼氢量有没有显著差别? 棉布 府绸 的确凉 尼龙
13
单因素方差分析SAS程序的输入: 循环语句 删除变量 CLASS和MODEL语句是必需的,CLASS必须出现在MODEL语句前。
14
单因素方差分析SAS程序输出结果: 结论: 在CLASS语句中指出的P值。P《0.003,可得出各衣料组间有非常显著差异。 组间占总的比例
15
2、两因素方差分析 例:用4种不同方法治疗8名病者,其血浆凝固时间的资料如表, 试分析影响血浆凝固的因素。 处理组 受试者编号(区组)
16
两因素方差分析SAS程序的输入:
17
两因素方差分析SAS程序输出结果: 结论:总误差:F=14.04,P《0.0001,故总体有非常显著差异。
A因素:F=6.62,P《0.0025,故认为因素A(治疗方法)对血浆凝固时间影响很大。 B因素:F=17.2,P《0.0001,故认为因素B(不同病者)对血浆凝固时间影响很大。
18
3、三因素方差分析(交互作用不存在) 例:五种防护服,由五人各在不同的五天中穿着测定脉搏数,如表。 试比较五种防护服对脉搏数有无不同。
受试者 试验日期 甲 乙 丙 丁 戊 A B C D E100.6 B C D E A115.2 C D E A B103.8 D E A B C110.6 E A B C D109.8
19
三因素方差分析SAS程序的输入:
20
三因素方差分析SAS程序输出结果: 结论: 因F=6.80, P《0.0011,故总体有非常显著差异。 其中K因素影响极大F=16.27,
因素P、C都无显著差异。
21
4、有交互因素的方差分析 例:治疗缺铁性贫血病人12例,分为4组给予不同治疗,一个月后观察红细胞增加(百万/mm),资料如表。试分析两种药物对红细胞增加的影响。 甲药(A) 不用(A0) 用(A1) 不用B0 用 B1 乙药(B)
22
有交互因素方差分析SAS程序的输入:
23
有交互因素方差分析SAS程序输出结果: 结论: 因F=98.75, P=0.0001<0.01,故总体有非常显著的差异,
因素A、B、A*B都对红细胞增加数有非常大的影响。
24
非平衡数据的方差分析(GLM过程) 在SAS/STAT中GLM(General Linear Models)过程分析功能最多。包括:
1、简单回归(一元) 2、加权回归 3、多重回归及多元回归 4、多项式回归 5、方差分析(尤其不平衡分析) 6、偏相关分析 7、协方差分析 8、多元方差分析 9、反应面模型分析 10、重复测量方差分析
25
MODEL语句反映因变量与自变量的模型,其形式:
GLM过程在方差分析中的应用: MODEL语句反映因变量与自变量的模型,其形式: 模型说明 模型类型 MODEL Y=A BC; 主效应 MODEL Y=A B A*B; 交互效应 MODEL Y=A B A(B); 嵌套效应 MODEL Y1 Y2=A B; 多元方差分析 MODEL Y=A X; 协方差分析 A,B,C是分类变量,X,Y是连续型变量。
26
1、不平衡单因素方差分析 例:健康男子各年龄组淋巴细胞转化率(%)如表,问各组淋巴细胞转化率的均数之间的差异是否显著?
11-20岁 41-50岁 61-75岁
27
不平衡单因素方差分析SAS程序的输入:
28
不平衡单因素方差分析SAS程序输出结果:
29
2、不平衡二因素方差别分析 假设如下数据作二因素方差分析 因素B b1 b2 b3
a1 a2 因素A
30
不平衡二因素方差分析SAS程序的输入:
31
不平衡二因素方差分析SAS程序输出结果:
结论: GLM按两种方法输出 1、按有交互作用输出 2、按主效应输出。
Similar presentations