Download presentation
Presentation is loading. Please wait.
2
第三篇 医学统计学方法
3
医学统计学方法 3 主讲人 陶育纯 http://cc.jlu.edu.cn/ss.html
医学统计分析 医学统计学方法 3 主讲人 陶育纯 流行病与卫生统计学教研室 教案
4
第四讲 课程名称:预防医学 主要教材: «卫生学» 第7版 仲来福 主编 人民卫生出版社 年级、专业:2011级医学五年制第一教班
仲来福 主编 人民卫生出版社 年级、专业:2011级医学五年制第一教班 授课时间:2013年11月11日 授课时数:4h
5
目录 第九章 数值变量资料的统计分析(续) 第三节 数值变量资料的统计推断 一、均数的抽样误差与标准误 二、t 分布
三、总体均数置信区间的估计 四、假设检验的基本思想和步骤
6
第四节 t 检验和 u 检验 一、样本均数与总体均数的比较 二、配对资料的比较 三、两个样本均数的比较 四、假设检验应注意的问题
7
第三节 数值变量资料的统计推断 第九章 数值变量资料的统计分析(续) 一、均数的抽样误差与标准误 ㈠ 均数的抽样误差
由于总体常常不能直接研究,因此从总体中随机抽取一定数量的观测值作为样本进行抽样研究(sampling study)成为统计研究的最基本的方法。变异的存在使得样本指标与总体指标不一定恰恰相等。这种由抽样造成的统计量与总体参数的差异叫抽样误差。抽样误差是不可避免的。
8
研究抽样误差的大小的变化规律对于由样本指标推断总体指标非常有意义。 统计学基础理论的中心极限定理指出:
㈡ 标准误 研究抽样误差的大小的变化规律对于由样本指标推断总体指标非常有意义。 统计学基础理论的中心极限定理指出: ① 从正态分布总体N(μ,σ2)中随机抽取容量 为n的样本,其样本均数 服从正态分布 。其中 可按下式计算: 式(9-18) ② 如果一个变量的总体分布具有均数μ和标 准差σ,则从该总体抽得的容量为n的样本,
9
在n趋于无穷大时,样本均数 的分布趋向正态分布 。
定理的直观表述见下图。 x总体 总体 n x1 样本1 x4 xi-2 n x2 xi 样本2 . . . x3 xi-1 n 样本j
10
为了理解中心极限定理,特用一个模拟实验 例子来说明。 通过计算这100个样本均数的均数和标准差, 来了解均数的抽样误差的变化规律。
例 某地假定1979年成都市16岁女学生的身高服从均数为155.4 cm、标准差为5.3cm的正态分布。用电子计算机做抽样模拟实验,从 N(155.4,5.32)的总体中,每次随机抽出10个数字(即样本含量n=10), 组成一个样本,求出样本均数 及标准差S。 例如1号样本的10数字为: 由此求得 ,S1=4.15。 仿此方式抽取100次,每次均抽出10个数字,可求得100个样 本均数及标准差,具体见表1。 通过计算这100个样本均数的均数和标准差, 来了解均数的抽样误差的变化规律。
11
表1 100个样本均数、标准差( =155.4cm, =5.3cm的模拟抽样实验)
12
求得此100个样本均数的均数及样本均数的标准差(称标准误)为:
由中心极限定理可知:①样本均数的总体均 数等于μ。本实验求得此100个样本均数的均数为 155.38,而μ= 155.4,二者非常相近。②标准误 按式(9-18)计算, 。本实验求得 的标准误为1.71,二者也很相近。
13
如果增大抽样次数,求得的均数与标准误将更加接近理论值。 再把上述实验求得的100个样本均数编制成频
数表(见表2),并绘制成直方图(见图1),可以看 到此频数分布近似正态分布;如果增大抽样次数, 频数分布将更加逼近正态分布。 当抽样次数趋近无穷大时,此抽样(即样本 含量n=10)所得到的样本均数的分布服从总体均 数也为μ,总体标准误为 的正态分布 (即 )。
14
表 个样本均数的频数表 图1 100个样本均数的直方图 下面的流程图将演示此模拟实验的全过程。
15
n=10 156.51 样本1 身高总体 样本 153.29 n= 10 样本2 152.46 157.11 155.68 . . . 样本100 n= 10 157.42 求样本均数 标准差
16
编制频数表 绘直方图 抽样次数增大 抽样次数
17
统计量的标准差称标准误(standard error)。 标准误是说明抽样误差大小的指标。标准误越大,
则抽样误差越大。均数的标准差则称均数的标准 误。 在实际工作中,总体标准差σ常常未知,而 用样本标准差S来估计,由此得到下式: 式(9-19) 利用标准误可以表示抽样误差的大小,可确 定总体均数的置信区间,可用于假设检验。
18
二、t 分布 ㈠ t 分布的概念 下述变换(标准化): 得到的变量u服从标准正态分布N( 0,1)。 由中心极限定理可知, 服从正态分布
若变量x服从正态分布N(μ,σ2),那么通过 下述变换(标准化): 得到的变量u服从标准正态分布N( 0,1)。 由中心极限定理可知, 服从正态分布 ,通过标准化即下述变换:
19
得到的变量u也服从标准正态分布N( 0,1)。
在实际应用中,总体标准差σ常常未知,而 用样本标准差S来估计,由此得到下述变换: 得到的变量t则服从t分布( t-distribution)。 ㈡ t 分布的图形 利用t分布的概率密度函数 f(t) ,可绘制t分布 曲线,见下图2。
20
图2 t 分布曲线 t分布曲线形态类似正态分布曲线。
21
② t分布具有一个参数ν(称自由度,ν=n-1)。 ν越小,曲线越扁平;ν越大,曲线越接近 标准正态分布;当ν→ ∞时,t 分布趋近于
标准正态分布。 t分布是一簇曲线。不同ν的t分布曲线见图9-7。 t分布渐近标准正态分布的动态演示见 。 ③ t分布曲线下面积分布有一定规律。
22
㈣ t 分布曲线下面积分布规律(即t界值表)
通过对t分布概率密度函数 f(t)求积分可以得 到t分布曲线下一定区间的面积(概率)。为便于 研究与应用,统计学家制作了专门的t界值表(见 302页表9-9)。t 界值常记为 。其中ν为自由度,α为概率。其意义为: 单侧概率:P(t≤-tα,ν)=α或P(t≥tα,ν)=α 双侧概率:P(t≤-tα/2,ν)+P(t≥tα/2,ν)=α 对于双侧概率意义的图形直观表达见下图3和 图4。
23
t(ν) 图3 t 分布曲线下面积分布示意
24
t(ν) 图4 t 分布曲线下单侧面积分布示意
25
三、总体均数置信区间的估计 点估计 参数估计 统计推断 区间估计 假设检验 点估计就是用样本指标代表总体指标。由于
(point estimation) 参数估计 统计推断 区间估计 (interval estimation) 假设检验 点估计就是用样本指标代表总体指标。由于 不能考虑抽样误差的大小,故很少用。 区间估计是按一定的概率(置信度)由样本
26
指标估计总体指标的可能范围。该范围常称某参 数的置信区间或可信区间(confidence interval,CI)。
置信度=1-α,常取95%或99%。 总体均数的置信区间可用下述通式求得: 式(9-22) 式中tα,ν为t界值,=1-置信度,ν=n-1。tα,ν值 可从教材302页表9-9查得。 当样本例数n足够大(n>50)时,可用下 述近似式求得: 式(9-23)
27
本(n>50)时用,后者则大小样本都可。 本例n=102>50,用式(9-23)求:
式(9-23)是式(9-22)的近似式,前者只能在大样 本(n>50)时用,后者则大小样本都可。 例9-13a 已知102名健康女大学生口腔温度均数 (℃),标准差S=0.198(℃),试估计该地健康女大学生口腔温度 的总体均数 。 本例n=102>50,用式(9-23)求: 95%CI :37.06±1.96× → (37.02,37.10) 99%CI :37.06±2.58× → (37.01,37.11) 该地健康女大学生口腔温度总体均数的95%置信区间为(37.02,37.10)℃ 。
28
根据资料可知,n=20<50,只能用式(9-22)求:
例9-13 随机抽取某地健康男子20人,测得该样本的收缩压 均数为118.4mmHg,标准差为10.8mmHg.试估计该地健康男子收缩 压总体均数的95%置信区间。 根据资料可知,n=20<50,只能用式(9-22)求: ν=n-1=19,查t界值表, t0.05/2,19=2.093, 95%CI :118.4±2.093×2.415 → (113.3,123.5) 该地健康男子收缩压总体均数的95%置信区间为(113.3,123.5)mmHg 。
29
四、假设检验的基本思想和步骤 ㈠ 假设检验的思维逻辑
假设检验(hypothesis testing)是统计推断中另一类非常重要的方法,是统计学中应用最广泛的方法,其意义和思维逻辑可通过下面的例题说明。 例6-1a 根据大量调查,已知正常成年男子脉搏均数为72次/分。某医生在一山区随机抽查了25名健康成年男子,求得其脉搏均数为74.2次/分,标准差为6.0次/分。能否据此认为该山区成年男子脉搏均数高于一般成年男子脉搏均数?
30
在本例中,山区成年男子脉搏均数用μ山表示,一般成年男子脉搏均数用μ0表示。
μ山= ? μ0=72次/分 n=25 一般总体 山区总体
31
μ山>μ0 μ山<μ0 这里μ山与μ0的关系只能有两种: ① μ山=μ0 ② μ山≠μ0 这里根据专业知识,μ山≠μ0的关系中只能是
μ山>μ0 。造成二种情况的原因有: ① μ山=μ0 (同一总体)→ 抽样误差 ② μ山≠μ0 (不同总体)→ 本质不同
32
㈡ 假设检验的基本步骤 ⑴ 建立检验假设和确定检验水准 检验假设有两种:
① 检验假设(hypothesis under test)又称零/原 假设(null hypothesis)。用H0表示。假定通常 为:某两个(或多个)总体参数相等,或某 两个总体参数之差等于0,或某资料服从某一 特定分布(正态分布、Poisson分布)等。本 例则为:H0: μ山=μ0 。
33
② 备择假设(alternative hypothesis)又称对立 假设。用H1表示。H1与H0对立。H1的内容可
即为单侧检验(one-sided test)或单尾检验(one- tailed test)。若H1: μ山≠μ0 则为双侧检验 (two-sided test)或双尾检验(two-tailed test)。 单双侧的选择在检验之前由专业知识确定。 ③ 检验水准(size of a test)是假设检验作判断 结论的标准,是预先确定的概率值,常常取 小概率事件标准。用α表示。也为I型错误
34
的概率大小(详后)。实际工作中,α常取0.05。
⑵ 选定检验方法和计算检验统计量 应根据变量或资料的类型、分析的目的、设 计的方案、检验方法的适用条件等选择检验方法。 检验统计量(test statistic)是在H0假设的条件 下由统计学家推导出的可由样本指标计算出来用 于推断结论的数值。 检验方法常用检验统计量的名称命名。如t 检 验中的t 统计量、 u 检验中的u 统计量、χ2检验中 的χ2统计量等。
35
抽得等于及大于(或等于及小于)现有样本获得 的检验统计量的概率。 通俗地讲,P值就代表了H0成立与否的概率。
推断结论应包含统计结论和专业结论两部分。 若P ≤α,则按α检验水准拒绝H0,有统计学意义(统计结论),可认为……不同或不等(专业结论)。
36
若P >α,则按α检验水准尚不拒绝H0,无 统计学意义,还不能认为……不同或不等。 下面通过例6-1a具体介绍假设检验的过程:
单侧,α= 0.05
37
H0,有统计学意义。可认为该山区成年男子脉 搏数高于一般成年男子脉搏数。
Why ??? Answer is on next page ! ν=24,查单侧tα,ν= t0.05,24=1.711,今求得 t =1.833>1.711, P<0.05,按α=0.05水准拒绝 H0,有统计学意义。可认为该山区成年男子脉 搏数高于一般成年男子脉搏数。 上述例6-1a属于单样本t检验,其假设检验的 推断结果是依据t分布的原理作出的。为了理解其 推断过程的原理,通过直观的示意图(见下图6-1a)表达上述例题假设检验的过程。
38
H0: μ山=μ0 μ山=μ0 μ山>μ0 P <0.05 α=0.05 α=0.05 P 单侧tα,ν= t0.05,24 t=1.833
ν=24 α=0.05 α=0.05 P 单侧tα,ν= t0.05,24 t=1.833 μ山=μ0 μ山>μ0 1.711 接受域 拒绝域 图6-1a
39
下面列出其具体的假设检验过程: H0: μ=μ0 =140.0g/L H1: μ≠μ0 =140.0g/L α= 0.05
例6-1b 某地抽样调查了280名健康成年男性的血红蛋白含量,其均数为136.0g/L,标准差为6.0g/L。已知正常成年男性的血红蛋白的均数为140.0g/L。试问能否认为该地所有健康成年男性的血红蛋白含量与正常成年男性的血红蛋白含量的均数不同? 下面列出其具体的假设检验过程: H0: μ=μ0 =140.0g/L H1: μ≠μ0 =140.0g/L α= 0.05
40
H0,有统计学意义。可认为该地所有健康成年男性的血红蛋白含量与正常成年男性的血红蛋白含量的均数不同。
ν=279,查tα/2,ν= t0.05/2,279=1.969,今求得 t =11.16>1.969, P<0.05,按α=0.05水准拒绝 H0,有统计学意义。可认为该地所有健康成年男性的血红蛋白含量与正常成年男性的血红蛋白含量的均数不同。 若查表,自由度可取比279小的最接近的200,即t0.05/2,200=1.972。 上述例6-1b属于双样本t 检验,其假设检验 的推断结果是依据t分布的原理作出的。为了理解 其推断过程的原理,通过直观的示意图(见下图6-1b)表达上述例题假设检验的过程。
41
H0: μ=μ0 μ<μ0 μ=μ0 μ>μ0 α=0.05 α=0.05 P P <0.05 t=-11.16 t=11.16
ν=279 α=0.05 α=0.05 P P <0.05 t=-11.16 双侧tα,ν= t0.05/2,279 t=11.16 μ<μ0 μ=μ0 μ>μ0 -1.969 1.969 拒绝域 接受域 拒绝域 图6-1b
42
第四节 t 检验和u检验 t 检验(t-test,亦称Student’s t-test)和u 检验(
u-test),二者都是用于定量资料的假设检验的方法。 都可用于两组之内的样本均数与总体均数或样本均数之间的比较,目的在于推断样本均数所代表的未知总体均数与已知的总体均数或两个样本均数所代表的未知总体均数之间的差别。 t 检验的应用条件:理论上要求样本来自正态分布总体,两个样本均数比较时还要求两样本的总体方差相等,即方差齐性(homogeneity)。
43
一、一组样本资料的t 检验 u 检验的应用条件:样本较大( n>50 ),或 n虽小但总体标准差已知(少见)。
式(9-24a) 例题见教材的例9-15 。(略)
44
二、配对设计资料的t 检验 配对t 检验: 用于配对设计的定量资料的样本均数比较。配对设计主要有两种: 同种处理的 前后 同源配对 配对设计
两种不同的 处理 异源配对 用于推断两种处理或处理前后的结果有无差 别。利用两种处理或处理前后的差值d的样本均数 所代表的未知总体均数μd 与已知的总体均数
45
μ0=0的比较。其检验统计量的计算公式为: 式(9-24) 式中d为每对数据的差值, 为差值的样本均数,Sd
为差值的标准差, 为差值样本均数的标准误,n为对子 数。 例6-2a 某护师随机抽取10名健康女大学生,在午饭后休息1小时,测试口腔温度,体温表分别在口腔中放置4分钟和7分钟,测试结果见表6-2a。试比较两种放置时间测试结果是否相同? 本试验属于同源配对中两种不同的处理的比较。
47
H0: μd=μ0=0 H1: μd ≠μ0 ≠0 α= 0.05
48
ν=n-1=10-1=9,查双侧tα/2,ν= t0.05/2,9=2.262,
今求得 t =5.45>2.262 ,P<0.05,按α=0.05水准 拒绝H0,有统计学意义。可认为测试时间长短对 测试结果有影响,7分钟测试结果高于4分钟。 本题的计算可利用计算器的统计功能简化计算过程, 把10个差值d作为原始数据输入计算器中,可直接得到 和Sd 。 教材的例9-16(自学)。
49
三、1. 两组独立样本资料的t 检验 两样本t 检验 亦称成组t 检验。用于完全随机设计的定量资料的两样本均数的比较,目的是推断两样本均数各自所代表的总体均数μ1和μ2是否相等。完全随机设计是指分别从两研究总体中随机抽取样本,然后比较两组的总体指标。 当两样本的总体方差相等(即方差齐)时,其检验统计量的计算公式为:
50
合并方差, S1、S2、n1 、n2分别为两样本的均数、 标准差、样本含量。
式(9-26、9-27、9-28) 式中 为两样本均数之差的标准误, 为两样本 合并方差, S1、S2、n1 、n2分别为两样本的均数、 标准差、样本含量。 例6-4a 某护师在15:00~16:00点间测得20名健康成年人的口腔温度,得: ,又测得21名成年甲亢患者的口腔温度,得: 。问甲亢患者的口腔温度是否与健康人不同? 本试验属于完全随机设计的两样本均数的比较。由于 S1与S2非常接近,故可认为满足方差齐性,可选用上述 式(9-26、9-27、9-28)进行假设检验。
51
H0: μ1=μ2 H1: μ1≠μ2 α= 0.05
52
上述式(9-26)只适用于满足方差齐性的两样本t检验,若方差不齐时,可采用近似t检验(亦称 检 验)或后述的秩和检验。
ν=n1+n2-2= =39 ,查双侧 t0.05/2,39≈ t0.05/2,30= 2.042,今求得 t =2.5959>2.042 , P< 0.05 ,按α=0.05水准拒绝H0,有统计学意义。 可认为甲亢患者的口腔温度高于健康人。 上述式(9-26)只适用于满足方差齐性的两样本t检验,若方差不齐时,可采用近似t检验(亦称 检 验)或后述的秩和检验。
53
*三、2. 两组独立样本资料的t’ 检验 Satterthwaite法。用于方差不齐的完全随机设计的定量资料的两样本均数的比较,目的是推断两个样本均数各自所代表的总体均数μ1和μ2是否相等。完全随机设计是指分别从两研究总体中随机抽取样本,然后比较两组的总体指标。 其检验统计量的计算公式为: 式(9-28a) 式(9-28b)
54
H0: μ1=μ2 H1: μ1≠μ2 α= 0.05 例6-5a 经硫酸氧钒治疗的大鼠与未治疗大鼠的血糖含量比较。
已知DV组12只,血糖含量(mmol/L) ;D组8只, 。问两组的血糖含量的总体均数是否不同? 本试验属于完全随机设计的两样本均数的比较。由于 S1与S2相差较大,故先做方差齐性检验,结果参见下述计 算。由于结论为方差不齐,故选用t’ 检验。 H0: α= 0.05 H0: μ1=μ2 H1: H1: μ1≠μ2 α= 0.05 附表9-12a 查得F0.05/2(7, 11)=3.76,今求得F=9.87>3.76,P < 0.05,方差不齐。
55
查表9-9(t界值表),得t0.05/2,8=2.306,知P<0.05, 在α=0.05水平上拒绝H0。所以可认为
经硫酸氧钒治疗的大鼠与未治疗大鼠的血糖含量不同。
56
*三、3. 两组独立样本资料的方差齐性检验 该方法用于推断两组独立正态随机样本所代表
的总体方差是否齐同,是检验两样本t检验是否满足方差齐性条件的方法之一。 例6-6a 某护师在15:00~16:00点间测得20名健康成年人的口腔温度,得: ,又测得21名成年甲亢患者的口腔温度,得: 。问甲亢患者的口腔温度的总体方差是否与健康人相同?
57
在本例中,健康成年人总体方差用 表示,成年甲亢患者总体方差用 表示。
在本例中,健康成年人总体方差用 表示,成年甲亢患者总体方差用 表示。 H0: H1: α= 0.05 式(9-28c)
58
ν1为分子自由度,ν2为分母自由度,可从教材的 附表9-12a查得。当α=0.05,ν1=9,ν2=27,其 此界值的意义见下面的图形:
F界值常用 表示,其中α为检验水准; ν1为分子自由度,ν2为分母自由度,可从教材的 附表9-12a查得。当α=0.05,ν1=9,ν2=27,其 此界值的意义见下面的图形:
59
H0: H1: α= 0.05 表9-12a 查得F0.05/2(19, 20)≈2.46,今求得F=1.11< 2.46,P >0.05,按α=0.05水准尚不拒绝H0,可认为有二者的总体方差相等,即满足方差齐性条件。See the picture on next page.
61
u 检验 1. 单样本u 检验 常用于一组大样本(n>50)定量资料的样本均数代表未知的总体均数μ和已知的总体均数μ0 (一般为理论值、标准值或经大量观察所得的稳定值)进行比较。其检验统计量的计算公式为: 式(9-25a)
62
上述式(9-25a)实际上是当n>50时,单样本t检验的式(9-24a)的近似式。 当σ已知时,只把式(9-25a)中的 换成
即可,但此公式很少用。 例6-1c 为了解医学生的心理健康问题,随机抽取了某医科大学在校生208名,用SCL-90量表进行了测定,算得因子总分的均数为144.9,标准差为35.82。现已知全国因子总分的均数(常模)为130,问该医科大学在校生的因子总分是否与全国水平相同? 本研究的样本例数n=208>50,属于大样本;因子总分属于定量变量;又已知一个总体指标130。故本题可用单样本u检验。
63
查u界值表(即表9-9 t界值表中ν=∞一行), uα/2= u0.05/2=1.96,今求得 u =5.999>1.96 ,P<
H0: μ=μ0=130 H1: μ ≠μ0 ≠130 α= 0.05 查u界值表(即表9-9 t界值表中ν=∞一行), uα/2= u0.05/2=1.96,今求得 u =5.999>1.96 ,P< 0.05,按α=0.05水准拒绝H0,有统计学意义。可 认为该医科大学在校生的因子总分与全国水平不 同。
64
P<0.05,按α=0.05水准也拒绝H0。二者所得结论完全一样。
本题若查专业t界值表,ν=208-1=207,查双 侧tα/2,ν= t0.05/2,207 =1.971,今求得t =5.999>1.971 , P<0.05,按α=0.05水准也拒绝H0。二者所得结论完全一样。 2. 两大样本u 检验 用于两大样本(n1、n2均 >50)的定量资料的两样本均数的比较,目的是推断两样本均数各自所代表的总体均数μ1和μ2是否相等。其检验统计量的计算公式为:
65
上述式(9-25)实际上是当n1、n2均 >50时,两样本t 检验的式(9-26)的近似式。
式中 为两样本均数之差的标准误, S1、S2、n1 、n2分别为两样本的均数、标准差、样本含量。 上述式(9-25)实际上是当n1、n2均 >50时,两样本t 检验的式(9-26)的近似式。 例6-4b 某社区护师在该地随机抽查了25~35岁健康人群的红细胞数,其中男性150人,得均数4.623(×1012/L),标准差0.571 (× 1012/L);女性120人,得均数4.211(×1012/L),标准差0.385 (×1012/L)。问该地健康人群红细胞数有无性别差异?
66
H0: μ1=μ2 H1: μ1≠μ2 α= 0.05 本题属于来自两个不同总体的两样本均数的比较。由
于n1=150与n2=120均大于50,故可用两大样本u检验。 H0: μ1=μ2 H1: μ1≠μ2 α= 0.05
67
已知双侧 u0. 05/2=1. 96,今求得 u =7. 057> 1. 96 , P<0. 05 ,按α=0
已知双侧 u0.05/2=1.96,今求得 u =7.057> 1.96 , P<0.05 ,按α=0.05水准拒绝H0,有统计学意义。可认为该地健康人群红细胞数有性别差异,男性高于女性。 本题若按两样本t检验求,得t为:
68
查专业t界值表,ν=n1+n2-2= =268, 查双侧tα/2,ν= t0.05/2,268 =1.969,今求得t =6.767 > 1.969, P<0.05,按α=0.05水准也拒绝H0。二者所得结论完全一样。 告诉你一个事实:统计 软件中只有t检验,没有u检 验。 想想 why ?
69
四、假设检验应注意的问题 1. 要有合理、严密的科研设计 这是假设检验的前提。如组间应具有可比性;保证样本的随机抽取;确定合理的样本含量等等。 2. 正确选用假设检验方法 应根据分析的目 的、资料的类型和分布特点、研究设计的方法、 样本含量的大小等选用适当的检验方法。需要熟 悉每种假设检验方法的适用条件及该方法的特点。 3. 合理选用单双侧检验 应根据分析的要求, 结合专业知识确定假设检验的单双侧,应在假设
70
statistically significant at 0.01 level
检验之前确定。一般取双侧检验较为稳妥。 4. 正确理解差别的统计学意义 差别有统计 学意义(statistically significant)常指P≤0.05的结 论称谓,差别有高度统计学意义常指P≤0.01的结 论称谓,二者均代表的是假设检验的推断结论的 概率大小,而不代表推断结论中的总体指标的差 别大小。有统计学意义不等于有专业意义或临床 意义,统计结论必须和专业结论结合起来,才能 得出符合客观实际的最终结论。 statistically significant at 0.01 level
71
依概率大小作出的,不可能百分之百的正确,应 避免使用诸如“肯定”、“一定”、“绝对”等词语下 结论。
5. 统计结论不能绝对化 假设检验的结论是 依概率大小作出的,不可能百分之百的正确,应 避免使用诸如“肯定”、“一定”、“绝对”等词语下 结论。 6. 统计结论的错误性 既然假设检验的结论 是依概率大小作出的,不论做出什么结论,都有 可能犯错误。假设检验的统计结论有可能犯两种 错误,一旦做出结论,则只犯一种。 Why ???
72
* 假设检验的功效 一、 假设检验的两类错误 I 型错误(type I error):拒绝了实际上是成
由于假设检验的推断结论是以概率作为保证的,因此无论是拒绝H0还是接受H0,都有可能发生以下两种错误之一,即I 型错误和II 型错误。 I 型错误(type I error):拒绝了实际上是成 立的H0。亦称“弃真”错误。其概率大小用α表示, 和检验水准一致,也是小概率事件的标准。 II 型错误(type II error):接受了实际上是 不成立的H0。亦称“存伪”错误。其概率大小用β
73
当n固定时,α愈小,β愈大;反之α愈大,β愈小。若要同时减小α与β,唯一的办法是增 加样本含量。
表示。其概率大小很难确切估计。 当n固定时,α愈小,β愈大;反之α愈大,β愈小。若要同时减小α与β,唯一的办法是增 加样本含量。 为了更好地理解两型错误的原理及相互关系, 以单侧z检验为例,用一个示意图(见图6-4和图6 -4a)来说明。
74
图6-4
75
图6-4a
76
二、假设检验的功效 1-β称为检验功效(power of a test),亦称检验效能。其意义是当两总体确有差异,按α检验水准所能发现该差异(拒绝H0)的能力。 如果1 -β=0.90,则意味着当H0不成立时,理论上在每100次抽样中,在α的检验水准上平均有90次能拒绝H0 。一般情况下对同一检验水准α, 功效大的检验方法更可取。 C
77
ν= ∞(标准正态曲线) f(t) ν= 4 ν= 1 图9-7 自由度分别为1、4、∞的t分布曲线
78
图中红色曲线为标准正态曲线,兰色曲线为t 分布 曲线, df 为自由度 。
Similar presentations