第三篇医学统计学方法. 第三篇医学统计学方法医学统计学方法 3 主讲人陶育纯医学统计分析医学统计学方法.

第三篇医学统计学方法

医学统计学方法 3 主讲人陶育纯 http://cc.jlu.edu.cn/ss.html
医学统计分析医学统计学方法 3 主讲人陶育纯流行病与卫生统计学教研室教案

第四讲课程名称：预防医学主要教材： «卫生学» 第7版仲来福主编人民卫生出版社年级、专业：2011级医学五年制第一教班
仲来福主编人民卫生出版社年级、专业：2011级医学五年制第一教班授课时间：2013年11月11日授课时数：4h

目录第九章数值变量资料的统计分析（续）第三节数值变量资料的统计推断一、均数的抽样误差与标准误二、t 分布
三、总体均数置信区间的估计四、假设检验的基本思想和步骤

第四节 t 检验和 u 检验一、样本均数与总体均数的比较二、配对资料的比较三、两个样本均数的比较四、假设检验应注意的问题

第三节数值变量资料的统计推断第九章数值变量资料的统计分析（续）一、均数的抽样误差与标准误㈠均数的抽样误差
由于总体常常不能直接研究，因此从总体中随机抽取一定数量的观测值作为样本进行抽样研究（sampling study）成为统计研究的最基本的方法。变异的存在使得样本指标与总体指标不一定恰恰相等。这种由抽样造成的统计量与总体参数的差异叫抽样误差。抽样误差是不可避免的。

研究抽样误差的大小的变化规律对于由样本指标推断总体指标非常有意义。统计学基础理论的中心极限定理指出:
㈡标准误研究抽样误差的大小的变化规律对于由样本指标推断总体指标非常有意义。统计学基础理论的中心极限定理指出: ① 从正态分布总体N(μ,σ2)中随机抽取容量为n的样本，其样本均数服从正态分布。其中可按下式计算：式(9-18) ② 如果一个变量的总体分布具有均数μ和标准差σ，则从该总体抽得的容量为n的样本，

在n趋于无穷大时，样本均数的分布趋向正态分布。
定理的直观表述见下图。 x总体总体 n x1 样本1 x4 xi-2 n x2 xi 样本2 . . . x3 xi-1 n 样本j

为了理解中心极限定理，特用一个模拟实验例子来说明。通过计算这100个样本均数的均数和标准差，来了解均数的抽样误差的变化规律。
例某地假定1979年成都市16岁女学生的身高服从均数为155.4 cm、标准差为5.3cm的正态分布。用电子计算机做抽样模拟实验，从 N(155.4,5.32)的总体中，每次随机抽出10个数字(即样本含量n=10)，组成一个样本，求出样本均数及标准差S。例如1号样本的10数字为：由此求得，S1=4.15。仿此方式抽取100次，每次均抽出10个数字，可求得100个样本均数及标准差，具体见表1。通过计算这100个样本均数的均数和标准差，来了解均数的抽样误差的变化规律。

表1 100个样本均数、标准差( =155.4cm,  =5.3cm的模拟抽样实验)

求得此100个样本均数的均数及样本均数的标准差(称标准误)为：
由中心极限定理可知：①样本均数的总体均数等于μ。本实验求得此100个样本均数的均数为 155.38，而μ= 155.4，二者非常相近。②标准误按式(9-18)计算，。本实验求得的标准误为1.71，二者也很相近。

如果增大抽样次数，求得的均数与标准误将更加接近理论值。再把上述实验求得的100个样本均数编制成频
数表(见表2)，并绘制成直方图(见图1)，可以看到此频数分布近似正态分布；如果增大抽样次数，频数分布将更加逼近正态分布。当抽样次数趋近无穷大时，此抽样（即样本含量n=10）所得到的样本均数的分布服从总体均数也为μ，总体标准误为的正态分布（即）。

表个样本均数的频数表图1 100个样本均数的直方图下面的流程图将演示此模拟实验的全过程。

n=10 156.51 样本1 身高总体样本 153.29 n= 10 样本2 152.46 157.11 155.68 . . . 样本100 n= 10 157.42 求样本均数标准差

编制频数表绘直方图抽样次数增大抽样次数 

统计量的标准差称标准误（standard error）。标准误是说明抽样误差大小的指标。标准误越大，
则抽样误差越大。均数的标准差则称均数的标准误。在实际工作中，总体标准差σ常常未知，而用样本标准差S来估计，由此得到下式：式(9-19) 利用标准误可以表示抽样误差的大小，可确定总体均数的置信区间，可用于假设检验。

二、t 分布㈠ t 分布的概念下述变换（标准化）：得到的变量u服从标准正态分布N( 0，1)。由中心极限定理可知，服从正态分布
若变量x服从正态分布N(μ,σ2)，那么通过下述变换（标准化）：得到的变量u服从标准正态分布N( 0，1)。由中心极限定理可知，服从正态分布，通过标准化即下述变换：

得到的变量u也服从标准正态分布N( 0，1)。
在实际应用中，总体标准差σ常常未知，而用样本标准差S来估计，由此得到下述变换：得到的变量t则服从t分布( t-distribution)。㈡ t 分布的图形利用t分布的概率密度函数 f(t) ，可绘制t分布曲线，见下图2。

图2 t 分布曲线 t分布曲线形态类似正态分布曲线。

② t分布具有一个参数ν(称自由度，ν=n-1)。 ν越小，曲线越扁平；ν越大，曲线越接近标准正态分布；当ν→ ∞时，t 分布趋近于
标准正态分布。 t分布是一簇曲线。不同ν的t分布曲线见图9-7。 t分布渐近标准正态分布的动态演示见。 ③ t分布曲线下面积分布有一定规律。

㈣ t 分布曲线下面积分布规律（即t界值表）
通过对t分布概率密度函数 f(t)求积分可以得到t分布曲线下一定区间的面积（概率）。为便于研究与应用，统计学家制作了专门的t界值表(见 302页表9-9)。t 界值常记为。其中ν为自由度，α为概率。其意义为：单侧概率：P(t≤-tα,ν)=α或P(t≥tα,ν)=α 双侧概率：P(t≤-tα/2,ν)+P(t≥tα/2,ν)=α 对于双侧概率意义的图形直观表达见下图3和图4。

t(ν) 图3 t 分布曲线下面积分布示意

t(ν) 图4 t 分布曲线下单侧面积分布示意

三、总体均数置信区间的估计点估计参数估计统计推断区间估计假设检验点估计就是用样本指标代表总体指标。由于
(point estimation) 参数估计统计推断区间估计 (interval estimation) 假设检验点估计就是用样本指标代表总体指标。由于不能考虑抽样误差的大小，故很少用。区间估计是按一定的概率（置信度）由样本

指标估计总体指标的可能范围。该范围常称某参数的置信区间或可信区间(confidence interval,CI)。
置信度=1-α，常取95%或99%。总体均数的置信区间可用下述通式求得：式(9-22) 式中tα,ν为t界值，=1-置信度，ν=n－1。tα,ν值可从教材302页表9-9查得。当样本例数n足够大（n＞50）时，可用下述近似式求得：式(9-23)

本（n＞50）时用，后者则大小样本都可。本例n=102>50，用式(9-23)求：
式(9-23)是式(9-22)的近似式，前者只能在大样本（n＞50）时用，后者则大小样本都可。例9-13a 已知102名健康女大学生口腔温度均数（℃），标准差S=0.198（℃），试估计该地健康女大学生口腔温度的总体均数。本例n=102>50，用式(9-23)求： 95%CI ：37.06±1.96× → （37.02，37.10） 99%CI ：37.06±2.58× → （37.01，37.11）该地健康女大学生口腔温度总体均数的95%置信区间为(37.02，37.10)℃ 。

根据资料可知，n=20<50，只能用式(9-22)求：
例9-13 随机抽取某地健康男子20人，测得该样本的收缩压均数为118.4mmHg，标准差为10.8mmHg.试估计该地健康男子收缩压总体均数的95%置信区间。根据资料可知，n=20<50，只能用式(9-22)求： ν=n－1=19，查t界值表， t0.05/2,19=2.093， 95%CI ：118.4±2.093×2.415 → （113.3，123.5）该地健康男子收缩压总体均数的95%置信区间为(113.3，123.5)mmHg 。

四、假设检验的基本思想和步骤㈠假设检验的思维逻辑
假设检验(hypothesis testing)是统计推断中另一类非常重要的方法,是统计学中应用最广泛的方法,其意义和思维逻辑可通过下面的例题说明。例6-1a 根据大量调查，已知正常成年男子脉搏均数为72次/分。某医生在一山区随机抽查了25名健康成年男子，求得其脉搏均数为74.2次/分，标准差为6.0次/分。能否据此认为该山区成年男子脉搏均数高于一般成年男子脉搏均数？

在本例中，山区成年男子脉搏均数用μ山表示，一般成年男子脉搏均数用μ0表示。
μ山= ？ μ0=72次/分 n=25 一般总体山区总体

μ山＞μ0 μ山＜μ0 这里μ山与μ0的关系只能有两种： ① μ山＝μ0 ② μ山≠μ0 这里根据专业知识，μ山≠μ0的关系中只能是
μ山＞μ0 。造成二种情况的原因有： ① μ山＝μ0 （同一总体）→ 抽样误差 ② μ山≠μ0 （不同总体）→ 本质不同

㈡假设检验的基本步骤 ⑴ 建立检验假设和确定检验水准检验假设有两种：
① 检验假设(hypothesis under test)又称零/原假设(null hypothesis)。用H0表示。假定通常为：某两个（或多个）总体参数相等，或某两个总体参数之差等于0，或某资料服从某一特定分布（正态分布、Poisson分布）等。本例则为：H0: μ山＝μ0 。

② 备择假设(alternative hypothesis)又称对立假设。用H1表示。H1与H0对立。H1的内容可
即为单侧检验(one-sided test)或单尾检验(one- tailed test)。若H1: μ山≠μ0 则为双侧检验 (two-sided test)或双尾检验(two-tailed test)。单双侧的选择在检验之前由专业知识确定。 ③ 检验水准(size of a test)是假设检验作判断结论的标准，是预先确定的概率值，常常取小概率事件标准。用α表示。也为I型错误

的概率大小(详后)。实际工作中，α常取0.05。
⑵ 选定检验方法和计算检验统计量应根据变量或资料的类型、分析的目的、设计的方案、检验方法的适用条件等选择检验方法。检验统计量(test statistic)是在H0假设的条件下由统计学家推导出的可由样本指标计算出来用于推断结论的数值。检验方法常用检验统计量的名称命名。如t 检验中的t 统计量、 u 检验中的u 统计量、χ2检验中的χ2统计量等。

抽得等于及大于（或等于及小于）现有样本获得的检验统计量的概率。通俗地讲，P值就代表了H0成立与否的概率。
推断结论应包含统计结论和专业结论两部分。若P ≤α，则按α检验水准拒绝H0，有统计学意义（统计结论），可认为……不同或不等（专业结论）。

若P ＞α，则按α检验水准尚不拒绝H0，无统计学意义，还不能认为……不同或不等。下面通过例6-1a具体介绍假设检验的过程：
单侧，α= 0.05

H0，有统计学意义。可认为该山区成年男子脉搏数高于一般成年男子脉搏数。
Why ??? Answer is on next page ! ν=24，查单侧tα,ν= t0.05,24=1.711，今求得 t =1.833＞1.711， P＜0.05，按α=0.05水准拒绝 H0，有统计学意义。可认为该山区成年男子脉搏数高于一般成年男子脉搏数。上述例6-1a属于单样本t检验，其假设检验的推断结果是依据t分布的原理作出的。为了理解其推断过程的原理，通过直观的示意图(见下图6-1a)表达上述例题假设检验的过程。

H0: μ山＝μ0 μ山＝μ0 μ山＞μ0 P ＜0.05 α=0.05 α=0.05 P 单侧tα,ν= t0.05,24 t=1.833
ν=24 α=0.05 α=0.05 P 单侧tα,ν= t0.05,24 t=1.833 μ山＝μ0 μ山＞μ0 1.711 接受域拒绝域图6-1a

下面列出其具体的假设检验过程： H0: μ＝μ0 =140.0g/L H1: μ≠μ0 =140.0g/L α= 0.05
例6-1b 某地抽样调查了280名健康成年男性的血红蛋白含量，其均数为136.0g/L，标准差为6.0g/L。已知正常成年男性的血红蛋白的均数为140.0g/L。试问能否认为该地所有健康成年男性的血红蛋白含量与正常成年男性的血红蛋白含量的均数不同？下面列出其具体的假设检验过程： H0: μ＝μ0 =140.0g/L H1: μ≠μ0 =140.0g/L α= 0.05

H0，有统计学意义。可认为该地所有健康成年男性的血红蛋白含量与正常成年男性的血红蛋白含量的均数不同。
ν=279，查tα/2,ν= t0.05/2,279=1.969，今求得 t =11.16＞1.969， P＜0.05，按α=0.05水准拒绝 H0，有统计学意义。可认为该地所有健康成年男性的血红蛋白含量与正常成年男性的血红蛋白含量的均数不同。若查表，自由度可取比279小的最接近的200，即t0.05/2,200=1.972。上述例6-1b属于双样本t 检验，其假设检验的推断结果是依据t分布的原理作出的。为了理解其推断过程的原理,通过直观的示意图(见下图6-1b)表达上述例题假设检验的过程。

H0: μ＝μ0 μ＜μ0 μ＝μ0 μ＞μ0 α=0.05 α=0.05 P P ＜0.05 t=-11.16 t=11.16
ν=279 α=0.05 α=0.05 P P ＜0.05 t=-11.16 双侧tα,ν= t0.05/2,279 t=11.16 μ＜μ0 μ＝μ0 μ＞μ0 -1.969 1.969 拒绝域接受域拒绝域图6-1b

第四节 t 检验和u检验 t 检验(t-test,亦称Student’s t-test)和u 检验(
u-test),二者都是用于定量资料的假设检验的方法。都可用于两组之内的样本均数与总体均数或样本均数之间的比较，目的在于推断样本均数所代表的未知总体均数与已知的总体均数或两个样本均数所代表的未知总体均数之间的差别。 t 检验的应用条件：理论上要求样本来自正态分布总体，两个样本均数比较时还要求两样本的总体方差相等，即方差齐性(homogeneity)。

一、一组样本资料的t 检验 u 检验的应用条件：样本较大( n＞50 )，或 n虽小但总体标准差已知（少见）。
式(9-24a) 例题见教材的例9-15 。（略）

二、配对设计资料的t 检验配对t 检验：用于配对设计的定量资料的样本均数比较。配对设计主要有两种：同种处理的前后同源配对配对设计
两种不同的处理异源配对用于推断两种处理或处理前后的结果有无差别。利用两种处理或处理前后的差值d的样本均数所代表的未知总体均数μd 与已知的总体均数

μ0=0的比较。其检验统计量的计算公式为：式(9-24) 式中d为每对数据的差值，为差值的样本均数，Sd
为差值的标准差，为差值样本均数的标准误，n为对子数。例6-2a 某护师随机抽取10名健康女大学生，在午饭后休息1小时，测试口腔温度，体温表分别在口腔中放置4分钟和7分钟，测试结果见表6-2a。试比较两种放置时间测试结果是否相同？本试验属于同源配对中两种不同的处理的比较。

H0: μd＝μ0=0 H1: μd ≠μ0 ≠0 α= 0.05

ν=n-1=10-1=9，查双侧tα/2,ν= t0.05/2,9=2.262，
今求得 t =5.45＞2.262 ，P＜0.05，按α=0.05水准拒绝H0，有统计学意义。可认为测试时间长短对测试结果有影响，7分钟测试结果高于4分钟。本题的计算可利用计算器的统计功能简化计算过程，把10个差值d作为原始数据输入计算器中，可直接得到和Sd 。教材的例9-16（自学）。

三、1. 两组独立样本资料的t 检验两样本t 检验亦称成组t 检验。用于完全随机设计的定量资料的两样本均数的比较，目的是推断两样本均数各自所代表的总体均数μ1和μ2是否相等。完全随机设计是指分别从两研究总体中随机抽取样本，然后比较两组的总体指标。当两样本的总体方差相等（即方差齐）时，其检验统计量的计算公式为：

合并方差， S1、S2、n1 、n2分别为两样本的均数、标准差、样本含量。
式(9-26、9-27、9-28) 式中为两样本均数之差的标准误，为两样本合并方差， S1、S2、n1 、n2分别为两样本的均数、标准差、样本含量。例6-4a 某护师在15:00~16:00点间测得20名健康成年人的口腔温度，得：，又测得21名成年甲亢患者的口腔温度，得：。问甲亢患者的口腔温度是否与健康人不同？本试验属于完全随机设计的两样本均数的比较。由于 S1与S2非常接近，故可认为满足方差齐性，可选用上述式(9-26、9-27、9-28)进行假设检验。

H0: μ1＝μ2 H1: μ1≠μ2 α= 0.05

上述式(9-26)只适用于满足方差齐性的两样本t检验，若方差不齐时，可采用近似t检验（亦称检验）或后述的秩和检验。
ν=n1+n2-2= =39 ，查双侧 t0.05/2,39≈ t0.05/2,30= 2.042，今求得 t =2.5959＞2.042 ， P＜ 0.05 ，按α=0.05水准拒绝H0，有统计学意义。可认为甲亢患者的口腔温度高于健康人。上述式(9-26)只适用于满足方差齐性的两样本t检验，若方差不齐时，可采用近似t检验（亦称检验）或后述的秩和检验。

*三、2. 两组独立样本资料的t’ 检验 Satterthwaite法。用于方差不齐的完全随机设计的定量资料的两样本均数的比较，目的是推断两个样本均数各自所代表的总体均数μ1和μ2是否相等。完全随机设计是指分别从两研究总体中随机抽取样本，然后比较两组的总体指标。其检验统计量的计算公式为：式(9-28a) 式(9-28b)

H0: μ1＝μ2 H1: μ1≠μ2 α= 0.05 例6-5a 经硫酸氧钒治疗的大鼠与未治疗大鼠的血糖含量比较。
已知DV组12只，血糖含量(mmol/L) ；D组8只，。问两组的血糖含量的总体均数是否不同？本试验属于完全随机设计的两样本均数的比较。由于 S1与S2相差较大，故先做方差齐性检验，结果参见下述计算。由于结论为方差不齐，故选用t’ 检验。 H0: α= 0.05 H0: μ1＝μ2 H1: H1: μ1≠μ2 α= 0.05 附表9-12a 查得F0.05/2(7, 11)=3.76，今求得F=9.87＞3.76，P < 0.05，方差不齐。

查表9-9（t界值表），得t0.05/2,8=2.306，知P<0.05, 在α=0.05水平上拒绝H0。所以可认为
经硫酸氧钒治疗的大鼠与未治疗大鼠的血糖含量不同。

*三、3. 两组独立样本资料的方差齐性检验该方法用于推断两组独立正态随机样本所代表
的总体方差是否齐同，是检验两样本t检验是否满足方差齐性条件的方法之一。例6-6a 某护师在15:00~16:00点间测得20名健康成年人的口腔温度，得：，又测得21名成年甲亢患者的口腔温度，得：。问甲亢患者的口腔温度的总体方差是否与健康人相同？

在本例中，健康成年人总体方差用表示，成年甲亢患者总体方差用表示。
在本例中，健康成年人总体方差用表示，成年甲亢患者总体方差用表示。 H0: H1: α= 0.05 式(9-28c)

ν1为分子自由度，ν2为分母自由度，可从教材的附表9-12a查得。当α=0.05，ν1=9，ν2=27，其此界值的意义见下面的图形：
F界值常用表示，其中α为检验水准； ν1为分子自由度，ν2为分母自由度，可从教材的附表9-12a查得。当α=0.05，ν1=9，ν2=27，其此界值的意义见下面的图形：

H0: H1: α= 0.05 表9-12a 查得F0.05/2(19, 20)≈2.46，今求得F=1.11< 2.46，P ＞0.05，按α=0.05水准尚不拒绝H0，可认为有二者的总体方差相等，即满足方差齐性条件。See the picture on next page.

u 检验 1. 单样本u 检验常用于一组大样本(n＞50)定量资料的样本均数代表未知的总体均数μ和已知的总体均数μ0 (一般为理论值、标准值或经大量观察所得的稳定值)进行比较。其检验统计量的计算公式为：式(9-25a)

上述式(9-25a)实际上是当n＞50时，单样本t检验的式(9-24a)的近似式。当σ已知时，只把式(9-25a)中的换成
即可，但此公式很少用。例6-1c 为了解医学生的心理健康问题，随机抽取了某医科大学在校生208名，用SCL-90量表进行了测定，算得因子总分的均数为144.9，标准差为35.82。现已知全国因子总分的均数(常模)为130，问该医科大学在校生的因子总分是否与全国水平相同？本研究的样本例数n=208＞50，属于大样本；因子总分属于定量变量；又已知一个总体指标130。故本题可用单样本u检验。

查u界值表(即表9-9 t界值表中ν=∞一行)， uα/2= u0.05/2=1.96，今求得 u =5.999＞1.96 ，P＜
H0: μ＝μ0=130 H1: μ ≠μ0 ≠130 α= 0.05 查u界值表(即表9-9 t界值表中ν=∞一行)， uα/2= u0.05/2=1.96，今求得 u =5.999＞1.96 ，P＜ 0.05，按α=0.05水准拒绝H0，有统计学意义。可认为该医科大学在校生的因子总分与全国水平不同。

P＜0.05，按α=0.05水准也拒绝H0。二者所得结论完全一样。
本题若查专业t界值表，ν=208-1=207，查双侧tα/2,ν= t0.05/2,207 =1.971，今求得t =5.999＞1.971 ， P＜0.05，按α=0.05水准也拒绝H0。二者所得结论完全一样。 2. 两大样本u 检验用于两大样本(n1、n2均＞50)的定量资料的两样本均数的比较，目的是推断两样本均数各自所代表的总体均数μ1和μ2是否相等。其检验统计量的计算公式为：

上述式(9-25)实际上是当n1、n2均＞50时，两样本t 检验的式(9-26)的近似式。
式中为两样本均数之差的标准误， S1、S2、n1 、n2分别为两样本的均数、标准差、样本含量。上述式(9-25)实际上是当n1、n2均＞50时，两样本t 检验的式(9-26)的近似式。例6-4b 某社区护师在该地随机抽查了25~35岁健康人群的红细胞数，其中男性150人，得均数4.623(×1012/L)，标准差0.571 (× 1012/L)；女性120人，得均数4.211(×1012/L)，标准差0.385 (×1012/L)。问该地健康人群红细胞数有无性别差异？

H0: μ1＝μ2 H1: μ1≠μ2 α= 0.05 本题属于来自两个不同总体的两样本均数的比较。由
于n1=150与n2=120均大于50，故可用两大样本u检验。 H0: μ1＝μ2 H1: μ1≠μ2 α= 0.05

已知双侧 u0. 05/2=1. 96，今求得 u =7. 057＞ 1. 96 ， P＜0. 05 ，按α=0
已知双侧 u0.05/2=1.96，今求得 u =7.057＞ 1.96 ， P＜0.05 ，按α=0.05水准拒绝H0，有统计学意义。可认为该地健康人群红细胞数有性别差异，男性高于女性。本题若按两样本t检验求，得t为：

查专业t界值表，ν=n1+n2-2= =268，查双侧tα/2,ν= t0.05/2,268 =1.969，今求得t =6.767 > 1.969, P＜0.05，按α=0.05水准也拒绝H0。二者所得结论完全一样。告诉你一个事实：统计软件中只有t检验，没有u检验。想想 why ?

四、假设检验应注意的问题 1. 要有合理、严密的科研设计这是假设检验的前提。如组间应具有可比性；保证样本的随机抽取；确定合理的样本含量等等。 2. 正确选用假设检验方法应根据分析的目的、资料的类型和分布特点、研究设计的方法、样本含量的大小等选用适当的检验方法。需要熟悉每种假设检验方法的适用条件及该方法的特点。 3. 合理选用单双侧检验应根据分析的要求，结合专业知识确定假设检验的单双侧，应在假设

statistically significant at 0.01 level
检验之前确定。一般取双侧检验较为稳妥。 4. 正确理解差别的统计学意义差别有统计学意义(statistically significant)常指P≤0.05的结论称谓，差别有高度统计学意义常指P≤0.01的结论称谓，二者均代表的是假设检验的推断结论的概率大小，而不代表推断结论中的总体指标的差别大小。有统计学意义不等于有专业意义或临床意义，统计结论必须和专业结论结合起来，才能得出符合客观实际的最终结论。 statistically significant at 0.01 level

依概率大小作出的，不可能百分之百的正确，应避免使用诸如“肯定”、“一定”、“绝对”等词语下结论。
5. 统计结论不能绝对化假设检验的结论是依概率大小作出的，不可能百分之百的正确，应避免使用诸如“肯定”、“一定”、“绝对”等词语下结论。 6. 统计结论的错误性既然假设检验的结论是依概率大小作出的，不论做出什么结论，都有可能犯错误。假设检验的统计结论有可能犯两种错误，一旦做出结论，则只犯一种。 Why ???

* 假设检验的功效一、假设检验的两类错误 I 型错误（type I error）：拒绝了实际上是成
由于假设检验的推断结论是以概率作为保证的，因此无论是拒绝H0还是接受H0，都有可能发生以下两种错误之一，即I 型错误和II 型错误。 I 型错误（type I error）：拒绝了实际上是成立的H0。亦称“弃真”错误。其概率大小用α表示，和检验水准一致，也是小概率事件的标准。 II 型错误（type II error）：接受了实际上是不成立的H0。亦称“存伪”错误。其概率大小用β

当n固定时，α愈小，β愈大；反之α愈大，β愈小。若要同时减小α与β，唯一的办法是增加样本含量。
表示。其概率大小很难确切估计。当n固定时，α愈小，β愈大；反之α愈大，β愈小。若要同时减小α与β，唯一的办法是增加样本含量。为了更好地理解两型错误的原理及相互关系，以单侧z检验为例，用一个示意图（见图6-4和图6 -4a）来说明。

图6-4

图6-4a

二、假设检验的功效 1-β称为检验功效（power of a test）,亦称检验效能。其意义是当两总体确有差异，按α检验水准所能发现该差异（拒绝H0）的能力。如果1 -β=0.90，则意味着当H0不成立时，理论上在每100次抽样中，在α的检验水准上平均有90次能拒绝H0 。一般情况下对同一检验水准α, 功效大的检验方法更可取。 C

ν= ∞(标准正态曲线) f(t) ν= 4 ν= 1 图9-7 自由度分别为1、4、∞的t分布曲线

图中红色曲线为标准正态曲线，兰色曲线为t 分布曲线， df 为自由度。

第三篇医学统计学方法. 第三篇医学统计学方法医学统计学方法 3 主讲人陶育纯医学统计分析医学统计学方法.

Similar presentations

Presentation on theme: "第三篇医学统计学方法. 第三篇医学统计学方法医学统计学方法 3 主讲人陶育纯医学统计分析医学统计学方法."— Presentation transcript:

Similar presentations

About project

反馈

请登录

Auth with social network:

第三篇 医学统计学方法. 第三篇 医学统计学方法 医学统计学方法 3 主讲人 陶育纯 医学统计分析 医学统计学方法.

Similar presentations

Presentation on theme: "第三篇 医学统计学方法. 第三篇 医学统计学方法 医学统计学方法 3 主讲人 陶育纯 医学统计分析 医学统计学方法."— Presentation transcript:

Similar presentations

About project

反馈

第三篇医学统计学方法. 第三篇医学统计学方法医学统计学方法 3 主讲人陶育纯医学统计分析医学统计学方法.

Presentation on theme: "第三篇医学统计学方法. 第三篇医学统计学方法医学统计学方法 3 主讲人陶育纯医学统计分析医学统计学方法."— Presentation transcript: