Statistical Methods in Medicine 卫生学第7版 第三篇 医学统计学方法 Statistical Methods in Medicine 1
第二节 正态分布和参考值范围的估计第三节 数值型变量资料的统计推断 第四节 t检验和u检验 第五节 方差分析 第九章 数值变量资料的统计分析(3) 第一节 数值型变量资料的统计描述 第二节 正态分布和参考值范围的估计第三节 数值型变量资料的统计推断 第四节 t检验和u检验 第五节 方差分析 2
“between groups” variability 组间变异 “within groups” variability 组内变异 Nomenclature Analysis of variance 方差分析 One-way analysis 单向分析 Two-way analysis 双向分析 Source of variation 变异来源 Grand mean 总平均值 Group mean 组平均值 “between groups” variability 组间变异 “within groups” variability 组内变异 F distribution F 分布 Multiple comparisons 多重比较 q test q 检验 Randomized block design 随机区组设计 3
饲料组(i) A B C D 肝脏相 对重量 Xij 2.62 2.82 2.91 3.92 2.23 2.76 3.02 3.00 2.36 2.43 3.28 3.32 2.40 2.73 3.18 3.04
第五节 方差分析 方差分析(analysis of variance,ANOVA) 第五节 方差分析 方差分析(analysis of variance,ANOVA) ◆可用于两个或两个以上样本均数的比较,但通常用于两个以上样本均数的比较。 ◆对资料的要求 ① 各样本是相互独立的随机样本; ② 各样本来自正态分布总体 ③ 且各总体方差相等。 ◆方差分析的基本思想是,按分析目的和实验设计把全部观察值之间的总变异分为两个或多个部分,然后再作分析。 ◆常用的设计有完全随机设计和随机区组设计的多个样本均数的比较。 4
方差分析的基本思想 以例9-14说明方差分析的基本思想。 用四种不同的饲料喂养大白鼠,每组4只动物,处死后测量肝脏的相对重量(肝重/体重)。试比较四个不同饲料组的平均值间有无差别。 本设计为完全随机设计的多个样本均数的比较。 5
①各饲料组内的4个数值不全相等,为随机误差(或个体差异),称为组内变异(“within groups” variation); 表9-14 四种饲料喂养的大白鼠肝脏相对重量 饲料组(i) 合计 A B C D 肝脏相 对重量 Xij 2.62 2.82 2.91 3.92 2.23 2.76 3.02 3.00 2.36 2.43 3.28 3.32 2.40 2.73 3.18 3.04 ΣXij 9.61 10.74 12.39 13.28 46.02 ni 4 16 Xi 2.4025 2.68502 3.0975 3.3200 2.8763 ΣXij2 23.1669 28.9278 38.4593 44.6304 135.1844 ①各饲料组内的4个数值不全相等,为随机误差(或个体差异),称为组内变异(“within groups” variation); ②各饲料组的均值也互不相同,其变异是由饲料因素 (处理因素)和随机误差造成的,称为组间变异(“between groups” variation) 。 6
列举存在的变异及意义 1、全部的16个实验数据之间大小不等,存在变异(总变异)。 2、各个组间存在变异(组间变异):反映处理因素之间的作用,以及随机误差。 3、各个组内个体间数据不同:反映了观察值的随机误差(组内变异)。
若处理因素(饲料)不起作用,则组间变异完全为随机误差所至,则组间变异与组内变异的比值将会接近于1; 分析组间变异与组内变异的比值(F 值)。 若处理因素(饲料)不起作用,则组间变异完全为随机误差所至,则组间变异与组内变异的比值将会接近于1; 若处理因素在组间变异中的作用很大时,组间变异与组内变异的比值就会远大于1。 基于这一思想,方差分析首先将总变异分解,然后计算各变异间的比值。若比值接近1,则认为处理因素无作用;若比值F大于1,且大于某一界值,则认为处理因素有显著作用。 F值有两个自由度:组间变异自由度=组数-1, 组内变异自由度=(Σni-1)-(组数-1 ), 7
ν1=df1, 分子自由度,组间变异自由度=组数-1。 ν2 =df2,分母自由度,组内变异自由度= =(Σni-1)-(组数-1 ) 。 F distribution 的示意图 (表9-12 F界值表) 8
完全随机设计: 对全部受试对象统一随机化分组 16只大白鼠的完全随机化分配方法 鼠号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 分组 A C D B B A 完全随机化分配结果: A组: 1, 6,12, 14 B组:4,5,10, 16 C组:2,7,8, 15 D组: 3, 9,11, 13 9
一、完全随机设计的多个样本平均值的比较 完全随机设计的多个样本平均值的比较又称单因素方差分析(One-way analysis) 。把总变异分解为组间(处理组间)变异和组内变异(误差)两部分。 目的是推断k个样本所分别代表的μl,μ2,…,μk是否相等,以便比较多个处理的差别有无统计学意义。 其计算公式见表9-13。方差分析中所需计算的统计量为 F,根据自由度ν1(组间)、ν2(组内)和α查表9-12“F界值表(方差分析用)”,作出统计推断结论。 若 ,则P>α,不拒绝H0,差异无统计学意义; 若 ,则P≤α, 拒绝H0,差异有统计学意义。 10
各种变异的表示方法 SS总 总 MS总 SS组内 组内 MS组内 SS组间 组间 MS组间 三者之间的关系: SS总= SS组内+ SS组间 总= 组内+ 组间
表9-13 完全随机设计的多个样本平均值比较的方差分析公式 表9-13 完全随机设计的多个样本平均值比较的方差分析公式 变异来源 离均差平方和SS 自由度ν 均方MS 统计量F 总 ∑Xij2-C N-1 组间 (处理组间) k-1 组内(误差) SS总-SS组间 N-k 总离均差平方和SS总= ∑∑(Xij-X)2=∑Xij2-(∑Xij)2/N 组间离均差平方和SS组间= ∑ni(Xi-X)2=∑(∑Xij)2/ni-(∑Xij)2/N 组内离均差平方和=∑∑(Xij-Xi)2=SS总—SS组间 =总离均差平方和—组间均离均差平方和 11
表9-14 四种饲料喂养的大白鼠肝脏相对重量(%) 表9-14 四种饲料喂养的大白鼠肝脏相对重量(%) A B C D 合计 ΣXij 9.61 10.74 12.39 13.28 46.02 ni 4 16 Xi 2.4025 2.68502 3.0975 3.3200 2.8763 ΣXij2 23.1669 28.9278 38.4593 44.6304 135.1844 假设检验的步骤: 建立检验假设,确定检验水准:α=0.05. H0:μl=μ2=μ3=μ4,四个饲料组的总体平均值相等, H1:μi≠μk, i, k=1,2,3,4; i≠k; 至少有一个成立。 (2) 选择统计方法,计算检验统计量。因为大于2组,选用完全随机设计的单因素方差分析方法。 SS总=∑Xij2-(∑Xij)2/N=135.1844-(46.02)2/16=2.8194 SS组间=∑(∑Xij)2/ni-(∑Xij)2/N =(9.612+10.742+12.392+13.282)/4- (46.02)2/16=2.0276, ν组间=4-1 SS组内=SS总 - SS组间= 2.8194- 2.0276=0.7918, ν组内=(4-1) ×4=12 12
按α=0.05水准拒绝H0,接受H1,四个饲料组的总体平均值不全相等。 (3) 确定概率P值,作出统计学推断。 查表9-12 F界值表(pages 295-296)得 F0.05(3,12)=3.49<10.24, P<0.05, 按α=0.05水准拒绝H0,接受H1,四个饲料组的总体平均值不全相等。 表9-15 例9-19资料的方差分析表 变异来源 SS ν MS F P 总 2.8194 15 组间 2.0276 3 0.6759 10.24 <0.001 组内 0.7918 12 0.0660 13
表9-14 四种饲料喂养的大白鼠肝脏平均相对重量(%) 表9-14 四种饲料喂养的大白鼠肝脏平均相对重量(%) 饲料组(i) A B C D 平均值Xi 2.4025 2.68502 3.0975 3.3200 要了解哪些组的平均值之间有差别,哪些组的平均值之间没有差别,需要进一步作平均值之间的两两比较。有比较次数为: m=k(k-1)/2 如当k=4时的比较次数为:m=4×3/2=6.0 A:B, A:C, A:D, B:C, B:D, C:D 14
四、多个样本均数间两两比较的q检验(p. 300~) 又称多重比较(multiple comparisons) 经方差分析后,若按α=0.05检验水准不拒绝H0,通常就不再作进一步分析; 若按α=0.05检验水准拒绝H0,且需了解任意两个总体均数间是否存在差别时,可进一步作多个样本均数间的两两比较(pairwise comparison)。 两两比较的方法较多,在此仅介绍较为常用的q检验 (Newman-Keuls法)。 15
多个样本均值之间两两比较的q检验(q test)公式: 式中, 为两两对比中任意两个对比组A、B的样本均值之差, 为两样本均值之差的标准误;nA,nB分别为A, B 两对比组的样本含量;MS误差为单因素方差分析中的组内均方(MS组内)或两因素方差分析中的误差均方(MS误差),下面将作介绍。 16
以算得的统计量q,根据误差自由度ν和平均值之间的组间间隔数a查表9-19“q界值表(Newman-Keul法用)”,作出统计推断结论。 判断标准: 若q<q0.05(ν,α),P>0.05 ,不拒绝H0,差异无统计学意义;若q≥q0.05(ν,α),P≤0.05,拒绝H0,差异有统计学意义。 q为按公式(9-29)计算的检验统计量, q0.05(ν,α)为q分布的临界值。 例9-21 对例9-20资料的四种饲料的肝脏重量作两两比较。 (1)建立检验假设,确定检验水准。 H0:μA=μB,两组饲料的相对肝脏总体平均值相等。 H1:μA≠μB,两组饲料的相对肝脏总体平均值不等。 检验水准:α=0.05 17
(2) 选择统计方法,计算检验统计量。方差分析中两两比较的q检验法。 ① 将四个样本均数由大到小排列编秩,且注明原处理组。 秩次 1 2 3 4 X 3.3200 3.0975 2.6850 2.4025 处理组 D C B A ② 计算 :本例各处理组的样本含量ni相等,按公式(8.12)计算两样本均数差的标准误。由例8.9得MS组内=5.017,n=8 ③ 计算出两两比较的q值,列入q检验计算表(表9-20) 18
表9-20 两两比较的q检验计算表 A与B 组距a q P (1) (2) (3) (4)=(2)/0.1285 (5) (6) (7) (1)与(4) 0.9175 4 7.140 4.202 5.50 <0.01 (1)与(3) 0.6350 3 4.942 3.77 5.05 (1)与(2) 0.2225 2 1.732 3.08 4.32 >0.05 (2)与(4) 0.6950 5.409 (2)与(3) 0.4125 3.210 <0.05 (3)与(4) 0.2825 2.198 19
第(1)列 为各对比组,如第一行中“ (1)与(4) ”指A为第1组、B为第4组,即两对比组分别为第一组和第四组。 q检验计算表的计算 在上表9-20中 第(1)列 为各对比组,如第一行中“ (1)与(4) ”指A为第1组、B为第4组,即两对比组分别为第一组和第四组。 第(2)列 为两对比组的均数之差,如第一行为 与 之差,余类推。 第(3)列 为四个样本均数按大小排列时,A、B两对比组范围内所包含的组数a,如第一行中“(1)与(4)”范围内包含4个组,故a=4。 第(4)列 是按公式(9-29)计算的统计量q值,式中的分母0.7919是按公式(9-30)计算出来的 , 第(5)、(6)栏 是根据误差自由度ν与组间跨哦度查“表9-19“q界值表”所得的q界值,本例ν误差=12, 如当a=4时,q0.05(12,4)=4.20,q0.01(12,4)=5.50,余类推。 20
(3) 确定P值,判断结果 比较表9-20中第4列中的统计量q与临界值q0.05(ν,a)或q0.01(ν,a) 得到下列统计学结论: 饲料D:饲料A的概率P<0.01,按α=0.01检验水准拒绝H0,接受H1。 饲料D:饲料B的概率P<0.05,按α=0.05检验水准拒绝H0,接受H1。 饲料D:饲料C的概率P>0.05,按α=0.05检验水准不拒绝H0。 饲料C:饲料A的概率P<0.01,按α=0.01检验水准拒绝H0,接受H1。 饲料C:饲料B的概率P<0.05,按α=0.05检验水准拒绝H0,接受H1。 饲料B:饲料A的概率P>0.05,按α=0.05检验水准不拒绝H0。 专业结论: 饲料D、C的肝脏相对重量较重,饲料B、A的肝脏相对重量较轻。 饲料组(i): A B C D 平均值Xi: 2.4025 2.68502 3.0975 3.3200 21
三、随机区组(配伍组)设计的多个样本平均值比较 随机区组设计(randomized block design)又称为双向方差分析(two-way ANOVA)。是配对设计的推广。 1. 配对设计的处理分为两个组,故每一配对组由两个受试对象组成,用t检验方法分析不同处理组的效应有无差别。 2. 方差分析中的处理有多个(>2)组, 故每一区组内的受试对象有多个。每一区组内的受试对象数与处理组数相等。 以处理组分为三个组(A,B,C)为例加以说明: 1号区组的3名受试对象:①,②,③。 ①→A,② →C,③ →B。 2号区组的3名受试对象:①,②,③。 ①→B,② →A,③ →C。 … b号区组的3名受试对象:①,②,③。 ①→C,② →B,③ →A。 随机化是按每一区组进行的,故称为随机区组设计。 22
推断k个处理组的样本平均值所代表的总体平均值:μ1,μ2,μ3,…,μk,是否相等。 符号: i: i=1,2,…,k为处理组号,k为处理组数。 j:j= 1,2,…,b为区组组号,b为区组数。 统计推断包括: 推断k个处理组的样本平均值所代表的总体平均值:μ1,μ2,μ3,…,μk,是否相等。 2. 推断b个区组的样本平均值所代表的总体样本平均值:μ1,μ2,μ3,…,μb,是否相等。 设计控制了个体差异对处理的影响,故可提高检验效率. 23
例9-20 在抗癌药物筛选中,观察4种药物对小鼠移植性肉瘤(S100)的抑瘤效果。采用随机区组设计方案。 共有20只小鼠,按体重相近的每4只小鼠配为一个区组。共有5个区组。 24
问题1. 各处理组的平均值是否相等?处理均方包含处理效应和随机误差,F=处理均方/误差均方>1? 表9-17 四种药物的抑瘤效果(瘤重,克) 区组号 (j) 药物种类(i) A B C D 1 0.80 0.36 0.17 0.28 1.61 0.40 2 0.74 0.50 0.42 2.02 0.51 3 0.31 0.20 0.38 0.25 1.14 0.29 4 0.48 0.18 0.44 0.22 1.32 0.33 5 0.76 0.26 0.13 1.43 3.09 1.50 1.69 1.24 7.52 0.62 0.30 0.34 2.0917 0.5196 0.6217 0.3358 3.5688 问题1. 各处理组的平均值是否相等?处理均方包含处理效应和随机误差,F=处理均方/误差均方>1? 问题2. 各区组的平均值是否相等?区组均方包含区组效应和随机误差,F=区组均方/误差均方>1? 25
H0:μl=μ2=μ3=μ4,四种药物的抑瘤效果相等, 方差分析步骤: (1)建立检验假设,确定检验水准。 处理组间(药物间): H0:μl=μ2=μ3=μ4,四种药物的抑瘤效果相等, H1: μi≠μg, i, g=1,2,3,4; i≠g,四种药物的抑瘤效果不等或不全相等。 α=0.05. 区组间: H0: μl=μ2=…=μ5,5个区组的总体平均值相等, H1:μj≠μt, j,t=1,…,5; j≠t. 5个区组的总体均数不等或不全相等。 26
(2) 选择统计方法,计算检验统计量。随机区组设计的方差分析方法。两个F值: 处理组效应的F值:F处理. 区组效应的F值:F区组. 计算步骤为:计算公式列于表9-16 ① 计算各种离均差平方和SS: SS总, SS处理, SS区组, SS误差。 27
② 计算各种自由度ν: ν总, ν处理, ν区组, ν误差。 ν总=N-1=20-1=19, ν处理=k-1=4-1=3, ν区组=b-1=5-1=4, ν误差= ν总- ν处理 - ν区组=19-3-4=12. ③ 计算各种均方MS: MS处理,MS区组,MS误差: MS处理=SS处理/ ν处理=0.41084/3=0.13695 MS区组= SS区组/ν区组=0.11233/4=0.02808 MS误差=SS误差/ ν误差=0.21811/12=0.01818 ④ 计算统计量F:F(处理),F(区组) F(处理)= MS处理/ MS误差=0.13695/0.01818=7.53 F(区组)= MS区组/ MS误差=0.02808/0.01818=1.54 ⑤ 列方差分析表:表9-18 28
表9-16 随机区组设计的多个样本均数比较的方差分析公式 表9-16 随机区组设计的多个样本均数比较的方差分析公式 变异 来源 离均差平方和SS 自由度ν 均方MS F 总 ΣX2-C N-1 处理间 k-1 区组间 b-1 误差 SS总-SS处理-SS区组 (k-1)(b-1) 29
关于处理效应, F0.05(3,12)=3.49<7.53,P<0.05, 拒绝H0 表9-18 例9-20资料的方差分析表 变异来源 SS ν MS F P 总 0.74128 19 处理组间 0.41084 3 0.13695 7.53 <0.01 区组间 0.11233 4 0.02808 1.54 >0.05 误差 0.21811 12 0.01818 (3) 确定P值,判断结果: 查表9-12 F 界值表得: 关于处理效应, F0.05(3,12)=3.49<7.53,P<0.05, 拒绝H0 关于区组效应,F0.05(4,12)=3.26>1.54,P>0.05, 不拒绝H0。 结论: 四种药物的抑瘤作用不全相同; ② 各区组间效应的差别无统计学意义。 30
四种药物抑瘤效果的两两比较,用q 检验法。 表9-17 四种药物的抑瘤效果(瘤重,克) 区组号 (j) 药物种类(i) A B C D 1 0.80 0.36 0.17 0.28 1.61 0.40 2 0.74 0.50 0.42 2.02 0.51 3 0.31 0.20 0.38 0.25 1.14 0.29 4 0.48 0.18 0.44 0.22 1.32 0.33 5 0.76 0.26 0.13 1.43 3.09 1.50 1.69 1.24 7.52 0.62 0.30 0.34 2.0917 0.5196 0.6217 0.3358 3.5688 四种药物抑瘤效果的两两比较,用q 检验法。 31
假设检验时,根据样本统计量作出的推断结论(拒绝H0或不拒绝H0)可能会发生错误。错误分两种类型: 第五节 假设检验中的注意事项 一、假设检验中的两类错误 假设检验时,根据样本统计量作出的推断结论(拒绝H0或不拒绝H0)可能会发生错误。错误分两种类型: ①当拒绝H0时,有可能犯拒绝错误。错误概率为α ②当不拒绝H0时,有可能接受错误。统计学判断不能绝对化。 二、要保证组间的可比性 这是假设检验的前提。所谓可比性就是各组间除了要比较的主要因素不相同以外,其它影响结果的因素应尽可能相同或基本相近。为了保证资料的可比性,必须要有严密的实验设计。 三、要根据研究目的、设计类型和资料类型选用适当的检验方法 32
本章主要内容的归纳—计量资料的分析 1. 描述性统计量:平均值指标,变异度指标 2. 个体分布的参考值范围估计:正态分布法,百分位数法 3. 平均值的抽样误差。抽样研究时,由于变异的存在,抽样误差是不可避免的。反映均数抽样误差大小的指标是标准误。当σ未知时,标准误的理论值可以用标准误的估计值来代表。 4.总体参数的100(1-α)%置信区件间估计,95%CI 5.假设检验。t检验、u检验和方差分析。 (1) 样本平均值与总体平均值之间的比较 (2) 完全随机设计的样本平均值之间的比较 (3) 配对设计(随机区组设计)的平均值之间的比较 (4) 平均值之间的多重比较 33
练习题 (一) 选择题:13,11,14。 (二) 思考题:4。 (三) 应用题:7。 34
离均差平方和的简捷计算公式的证明