第 八 章 t 检 验.

Slides:



Advertisements
Similar presentations
第五节 函数的微分 一、微分的定义 二、微分的几何意义 三、基本初等函数的微分公式与微分运算 法则 四、微分形式不变性 五、微分在近似计算中的应用 六、小结.
Advertisements

2.8 函数的微分 1 微分的定义 2 微分的几何意义 3 微分公式与微分运算法则 4 微分在近似计算中的应用.
2.5 函数的微分 一、问题的提出 二、微分的定义 三、可微的条件 四、微分的几何意义 五、微分的求法 六、小结.
第二节 换元积分法 一、第一类换元积分 法(凑微分法) 二、第二类换元积分法. 问题 解决方法 利用复合函数,设置中间变量. 过程令 一、第一类换元积分法(凑微分法)
全微分 教学目的:全微分的有关概念和意义 教学重点:全微分的计算和应用 教学难点:全微分应用于近似计算.
第八章 X2 检验 卫生(医学)统计学 普通高等教育 “ 十一五 ” 国家级规划教材. X 2 检验用途 1 、推断两个或两个以上的总体率或总体构 成比 之间有无差别; 2 、推断两种属性或两个变量之间有无关联 性; 3 、频数分布的拟合优度检验。
7.1 假设检验 1. 假设检验的基本原理 2. 假设检验的相关概念 3. 假设检验的一般步骤 4. 典型例题 5. 小结.
第十七章 分类资料的统计推断.
第四章 假设检验 第4.1节 假设检验的基本概念 第4.2节 正态总体均值与方差 的假设检验 第4.3节 非参数假设检验方法
第十二章 非参数检验 (Nonparametric test)
第六章 假设检验 主讲教师:王丽艳 徐栋.
07/16/96 概率统计 自考辅导.
6.9二元一次方程组的解法(2) 加减消元法 上虹中学 陶家骏.
第六章 方差分析 (Analysis of Variance,ANOVA)
第六章 假设检验基础.
6.6 单侧置信限 1、问题的引入 2、基本概念 3、典型例题 4、小结.
完全随机设计多样本资料秩和检验.
第 8 章 假设检验 作者:中国人民大学统计学院 贾俊平 PowerPoint 统计学.
计数资料的统计推断 (2 学时) 吴成秋 公共卫生学院预防医学系
四种命题 2 垂直.
1.1.3四种命题的相互关系 高二数学 选修2-1 第一章 常用逻辑用语.
常用逻辑用语复习课 李娟.
评估达力士软膏的长期有效性、安全性和耐受性
卡泊三醇增强PUVA治疗银屑病的疗效 目的 达力士联合PUVA治疗银屑病的疗效 E L Speight
第5章 定积分及其应用 基本要求 5.1 定积分的概念与性质 5.2 微积分基本公式 5.3 定积分的换元积分法与分部积分法
第三篇 医学统计学方法. 第三篇 医学统计学方法 医学统计学方法 实习2 主讲人 陶育纯 医学统计学方法 实习2 主讲人 陶育纯 流行病与卫生统计学教研室
本讲义可在网址 或 ftp://math.shekou.com 下载
不确定度的传递与合成 间接测量结果不确定度的评估
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
第四章 抽样误差与假设检验 要求: 掌握:均数的抽样误差与标准误,t分 布的特征,t界值表,总体均数可信区间及其与参考值范围的区别。
第三篇 医学统计学方法. 第三篇 医学统计学方法 医学统计学方法 3 主讲人 陶育纯 医学统计分析 医学统计学方法.
成组设计两样本均数的比较 赵耐青 卫生统计教研室.
第11章 秩转换的非参数检验 (nonparametric test).
t 检验——问题提出 假设检验是通过两组或多组的样本统计量的差别或样本统计量与总体参数的差异来推断他们相应的总体参数是否相同;
第三章 多维随机变量及其分布 §2 边缘分布 边缘分布函数 边缘分布律 边缘概率密度.
第八章 均值比较与检验 2019/1/11.
第十章 方差分析.
第三篇 医学统计学方法. 第三篇 医学统计学方法 医学统计学方法 实习3 主讲人 陶育纯 医学统计学方法 实习3 主讲人 陶育纯 流行病与卫生统计学教研室
第七章 参数估计 7.3 参数的区间估计.
医学统计学方法 实习3 主讲人 陶育纯 医学统计学方法 实习3 主讲人 陶育纯
习题 一、概率论 1.已知随机事件A,B,C满足 在下列三种情况下,计算 (1)A,B,C相互独立 (2)A,B独立,A,C互不相容
抽样和抽样分布 基本计算 Sampling & Sampling distribution
6.4不等式的解法举例(1) 2019年4月17日星期三.
3.8.1 代数法计算终点误差 终点误差公式和终点误差图及其应用 3.8 酸碱滴定的终点误差
模型分类问题 Presented by 刘婷婷 苏琬琳.
概 率 统 计 主讲教师 叶宏 山东大学数学院.
概 率 统 计 主讲教师 叶宏 山东大学数学院.
5.2 常用统计分布 一、常见分布 二、概率分布的分位数 三、小结.
完全随机设计多组资料的比较 赵耐青 卫生统计教研室.
§6.7 子空间的直和 一、直和的定义 二、直和的判定 三、多个子空间的直和.
相关与回归 非确定关系 在宏观上存在关系,但并未精确到可以用函数关系来表达。青少年身高与年龄,体重与体表面积 非确定关系:
第五节 缓冲溶液pH值的计算 两种物质的性质 浓度 pH值 共轭酸碱对间的质子传递平衡 可用通式表示如下: HB+H2O ⇌ H3O++B-
4) 若A可逆,则 也可逆, 证明: 所以.
第4课时 绝对值.
第四节 多个样本均数的两两比较 多个样本均数的两两比较又称多重比较(multiple comparison),其目的是推断究竟哪些总体均数之间存在差别。
第15讲 特征值与特征向量的性质 主要内容:特征值与特征向量的性质.
§5.2 抽样分布   确定统计量的分布——抽样分布,是数理统计的基本问题之一.采用求随机向量的函数的分布的方法可得到抽样分布.由于样本容量一般不止2或 3(甚至还可能是随机的),故计算往往很复杂,有时还需要特殊技巧或特殊工具.   由于正态总体是最常见的总体,故本节介绍的几个抽样分布均对正态总体而言.
第八章 假设检验 8.1 假设检验的基本概念.
第三节 随机区组设计的方差分析 随机区组设计资料的总平方和可以分解为三项: (10.10).
Statistical Methods in Medicine
第十五讲 区间估计 本次课讲完区间估计并开始讲授假设检验部分 下次课结束假设检验,并进行全书复习 本次课程后完成作业的后两部分
第八章 假设检验 8.3 两个正态总体参数的假设检验.
Sampling Error and Hypothesis Test
单样本检验.
FH实验中电子能量分布的测定 乐永康,陈亮 2008年10月7日.
二、配对样本t检验 配对设计(paired design)定义:将受试对象按某些重要特征相近的原则配成对子,每对中的两个个体随机地给予两种处理,称为随机配对设计。
一元一次方程的解法(-).
假设检验.
Presentation transcript:

第 八 章 t 检 验

应用时应了解各种检验方法的应用条件和检验统计量的计算方法。然后按假设检验的一般步骤来处理实际问题。 假设检验一般以检验统计量命名, 如 t 检验和 z 检验。 应用时应了解各种检验方法的应用条件和检验统计量的计算方法。然后按假设检验的一般步骤来处理实际问题。

t 检验的应用条件: 正态总体; ② 两小样本均数比较时,两样本均来自正态分 布总体,两样本的总体方差相等;若两总体 方差不齐可用t’检验; ① 单样本t检验中,σ 未知且n 较小,样本取自 正态总体; ② 两小样本均数比较时,两样本均来自正态分 布总体,两样本的总体方差相等;若两总体 方差不齐可用t’检验; ③ 两大样本均数比较时,可用Z检验。

1、样本均数与总体均数比较的 t 检验 使用范围:用于样本均数与已知总体均数(一般为理论值、标准值或经过大量观察所得的稳定值等)的比较。 分析目的:推断样本所代表的未知总体均数 与已知总体均数 0有无差别。 若 n 较大,则 , 可按算得的 t 值用 v = ∞ 查 t 界值表( t 即为 Z )得P值。

检验统计量 t 值的计算公式: 式中为 X样本均数, 0为已知总体均数,s为样本标准差,n为样本含量,为自由度。

例8.1 已知某地新生儿出生体重均数为3.36kg, 从该地随机抽取40名新生儿,测得其平均体重为3.27kg,标准差为0.44kg,问该地农村新生儿体重是否与该地新生儿平均出生体重不同?

(1) 建立检验假设,确定检验水准 H0:=3.36,该地农村新生儿体重与该地新生儿平均体重相同  =0.05

(2) 计算统计量 已知n=40, =3.27kg,S=0.44kg, =3.36kg。 按式(8.1) =n–1=40–1=39

(3) 确定P值,作出统计推断 查附表3,t界值表,t=-1.294的绝对值,得0.2<P<0.4,按 =0.05检验水准,不拒绝H0,结果无统计学意义,尚不能认为该地农村新生儿体重与该地新生儿平均体重不同。

二、配对设计均数比较的 t 检验 (配对t 检验) (paired/matched t-test for dependent samples)

配对设计资料有3种情况: 例 8.2 (P 92) ① 配对的两个受试对象分别接受两种处理 ② 同一样品(或对象)用两种方法或仪器检 测的结果 ③ 同一受试对象两个部位的检测结果 目的:推断两种处理(或方法)的结果有无差别。 例 8.2 (P 92)

配对设计资料的检验的基本思路: 解决这类问题,首先要求出各对差值(d)的均数。理论上,若两种处理无差别或某种处理不起作用时,差值d的均数应为0。所以对于配对设计的均数比较可看成样本均数 与总体均数( d =0)的比较:

式中 为样本中各对差值的均数, 为样本差值的标准差,n为对子数, 为自由度。

例 8.2 (1) 建立检验假设,确定检验水准 H0:d=0,儿童皮肤对不同结核菌素的反应性无差别 =0.05

(2) 计算统计量 今n=12, =d/n=39/12=3.25 差值的标准差为 按公式 =n–1=12–1=11

(3) 确定P值,作出统计推断 查附表3,t界值表,4.520>4.437,得P<0.001,按 =0.05水准,拒绝H0,接受H1。结果有统计学意义,可认为两种不同结核素对儿童皮肤反应性有差别。

三、两样本均数比较的t检验 目的:推断两个总体均数是否相等。

为两样本均数差值的标准误

在两总体方差相等的条件下,可将两方差合并,求合并方差(pooled variance)

表8.2 银屑病组与正常对照组的血清IL-6(pg/ml) 例8.3 某医生研究血清白介素-6(IL-6)与银屑病的关系,收集了12例处于进行期的银屑病患者及12例正常人的血清标本进行检测,得到如下结果,问银屑病患者与正常人的血清IL-6均数是否不同? 表8.2 银屑病组与正常对照组的血清IL-6(pg/ml) 组别 例数 均数 标准差 银屑病患者 12 182.4 27.7 正常人 149.7 19.5

(1) 建立假设检验,确定检验水准 H0:1=2,银屑病患者与正常人血清IL-6均数 相等, H1:12,银屑病患者与正常人血清IL-6均数 不相等, =0.05

(2) 计算统计量 今n1= 12, =182.4 pg/mL,S1=27.7 pg/mL, n2= 12 , =149.7 pg/mL,S2=19.5 pg/mL 按式(8.4)得 =n1+n2–2=12+12–2=22

(3) 确定P值,作出统计推断 查附表3,t界值表,得0.002<P<0.005,按 =0.05水准,拒绝H0,接受H1,结果有统计学意义,故可认为银屑病患者与正常人血清IL-6均数不同。

Z检验 Z检验(亦称Z-test)是用检验统计量Z来命名的。 用于样本含量n足够大(n>100)的样本均数与总体均数的比较、成组设计两样本均数的比较。 由于标准正态分布(分布)只有一条曲线,只要记住几个常用的界值,即可获得P值的大致范围,故检验可省去查t界值表的麻烦 。

(一)、单样本Z检验 式中 为样本均数,μ0为已知总体均数,s为样本标准差,n为样本含量。 适用于当n较大(n>100),检验统计量u值的计算公式为: 式中 为样本均数,μ0为已知总体均数,s为样本标准差,n为样本含量。

例 已知正常男性血色素μ0=14. 0g(%)。从某地区人群中随机抽取144名正常男性作为样本, = 14. 2g(%),s=1 例 已知正常男性血色素μ0=14.0g(%)。从某地区人群中随机抽取144名正常男性作为样本, = 14.2g(%),s=1.3g(%)。问该地区正常男性与一般正常男性血色素的差异有无不同?

(1)建立假设,确定检验水准 H0: μ=μ0 H1: μ≠μ0 =0.05 (2)计算统计量 μ0=14.0, n=144, =14.2, s=1.3

(3)确定P值 因为1.85<1.9600, 所以p>0.05。 (4)按=0.05检验水准,不拒绝H0,结果无统计学意义,尚不能认为该地区正常男性与一般正常男性血色素不同。

(二)、成组设计的两样本均数比较的Z检验 适用于两样本含量较大(n1、n2均大于50)时,

当两样本含量均大于50,即使总体分布偏离正态,其样本均数仍近似正态分布,可用 Z 检验。

例 为研究健康成年男、女血红蛋白有无差别,某地抽样调查了部分健康成人的血红蛋白含量,观察结果如下表。 表 健康成人的血红蛋白含量测定值(g/L) 性别 例数 均数 标准差 男 360 134.5 7.1 女 255 117.6 10.2

本资料是成组设计的两样本均数比较,可用t检验,由于两样本含量皆较大,也可用z检验以简化计算 (1) 建立假设检验,确定检验水准 H0:1=2,即健康成年男女血红蛋白没有差别,差 别是由抽样误差造成的。 H1: 1 ≠ 2 ,即即健康成年男女血红蛋白有差别。 =0.05(双侧)

(2) 计算统计量 今 =73.07, S1=10.75,n1=100 =80.30,S2=11.83,n2=105 将已知数据代入公式(9.26)中,得:

按  =0.05水准,拒绝H0,接受H1 。结果有统计学意义,可认为健康成年男、女血红蛋白含量有差别。 (3)确定P值,作出统计推断 按自由度v=∝,查t界值表,z0.001=3.2905,所以P<0.001。 按  =0.05水准,拒绝H0,接受H1 。结果有统计学意义,可认为健康成年男、女血红蛋白含量有差别。

正态性检验 1. 图示法 (直观) 2. 统计检验方法 P-P图(Proportion - proportion plots) (P96) Q-Q图 2. 统计检验方法 W检验 (S.S. Shapiro and M.B.Wilk) D检验 (D’ Agostino ) 矩法检验

方差齐性检验 两独立样本均数比较的t检验,要求相应的两总体方差相等,即方差具有齐性,若方差不齐时两小样本均数比较,需做t‘检验。 实际上,即使两总体方差相等,其两样本的方差,由于抽样误差的影响,也不一定相等。为此,我们要对两样本的方差作统计学检验。 实际上,即使两总体方差相等,其两样本的方差,由于抽样误差的影响,也不一定相等。为此,我们要对两样本的方差作统计学检验,检验两样本方差的不同是由于抽样误差引起的还是原来的两总体方差不同所造成的?

方差齐性检验

1=n1-1,2=n2-1

根据,1=n1-1,2=n2-1,查附表4方差齐性检验用的F分布表,如果,即P,因此拒绝H0,接受H1。可认为两个总体的方差不等。否则不拒绝H0,尚不能认为两个总体的方差不等。

例8.6 对例8.5进行方差齐性检验 肺癌病人: 矽肺0期病人: 例8.6 对例8.5进行方差齐性检验 例8.5由X线片上测得两组病人的R1值(肺门横径右侧距, cm),算得结果如下,试检验肺癌病人与矽肺0期病人的R1值的均数间差异是否明显。 肺癌病人: 矽肺0期病人:

1. H0:设两总体方差相等 H1:设两总体方差不等 α=0.1 2. 计算F值 3. 1= =N1-1=9,  2 =N2-1=49 查附表4,F0.1(9,49)=2.07,因为F 大于F0.1(9,49) 所以P<0.10,拒绝H0 。认为因为两总体方差的差异有统计学意义。 故不能用 t 检验而要用 t 检验。

假设检验的两型错误和检验效能 假设检验时,根据检验结果作出的判断,即拒绝或不拒绝H0,并不是百分之百的正确,可能发生两种错误。

第І类错误(type I error) 拒绝了实际上成立的H0,这类“弃真”错误称为第一类错误。 样本原本来自μ=μ0 的总体,由于抽样的偶然性得到了较大的t值,得到了较小的P值,落入了的拒绝域,从而做出拒绝的结论。

事实上,小概率事件只是在一次抽样中几乎不可能发生,而不是绝对不会发生。当小概率事件发生时,我们按照小概率事件原理拒绝了就犯了统计检验的错误。称这种错误为“弃真”,也称为第І类错误。

在假设检验中,拒绝H0有两种可能:(1) H0实际上不成立,拒绝它是对的;(2) H0实际上成立,我们拒绝错了。当实际上H0是正确的,但被我们拒绝了的时候,我们就犯了统计学检验的错误。

第ІІ类错误(type Ⅱ error) 不拒绝实际上不成立的H0,这类“存伪”的错误称为 II 型错误,其概率大小用  表示,其大小未知。

I 型错误和 II 型错误 实际情况 假设检验的结果 拒绝 H0 不拒绝 H0 推断正确(1-  ) H0 不正确 推断正确(1-) II 型错误()

正常人 误诊 H0 α H1 患者 β 漏诊 t (界值) 图7.1 两型错误示意图(以单侧t检验为例)

a 与 b 间的关系 减少(增加)I型错误,将会增加(减少)II型错误 增大n 同时降低a 与 b b a

同时减少α和ß的唯一方法是增加样本含量,因为增加了样本的含量后,均数的抽样误差小,样本均数更接近总体均数,因而可使犯第一类错误和第二类错误的概率同时减少。

检验效能(power of a test) 1- ß 称为检验效能或把握度,即两总体确有差别时,按α水准能发现它们有差别的能力。 实际情况 假设检验的结果 拒绝 H0 不拒绝 H0 H0 正确 I 型错误() 推断正确(1-  ) H0 不正确 检验效能(1-) II 型错误()

如1   = 0.90,意味着若两总体确有差别,则理论上在100次检验中,平均有90次能够得出有统计学意义的结论。所作的检验若有较大的1-β值,我们说该检验方法的检验功效较高,因为H0不成立时能够被及时检出。

假设检验的注意事项 1、要有严密的抽样研究设计 这是假设检验的前提。样本必须是从同质总体中随机抽取的;要保证组间的均衡性和资料的可比性,即除对比的主要因素(如用新药和用安慰剂)外,其它可能影响结果的因素(如年龄,性别,病程,病情轻重等)在对比组间应尽可能相同或相近。

应根据分析目的、资料类型、设计方案、资料的分布、样本含量的大小以及方法的适用条件等选择适宜的统计检验方法。 2、应满足假设检验方法的前提条件 应根据分析目的、资料类型、设计方案、资料的分布、样本含量的大小以及方法的适用条件等选择适宜的统计检验方法。

两样本均数比较方法的选择 n1+n2? 小样本 大样本 方差? z检验 方差齐 方差不齐 t 检验 t ’检验

P值是指在成立的前提下,出现现有样本统 计量以及更极端情况的概率。 P值越小,说明在 H0成立的条件下,得到现有样本的可能性越小, 越有理由拒绝H0。

P值的大小不仅与总体参数间的差别有关,而且与抽样误差等有关。不能认为P值越小,总体参数间的差别越大。假设检验只做出拒绝或不拒绝的定性结论,但不能给出总体参数间差别大小的结论。

4、结论不能绝对化 统计结论具有概率性质,不宜用“肯定”,“一定”,“必定”等词。 报告结果时应注意措辞,应列出检验水准、检验统计量值, P 值的确切范围、统计结论和专业结论。

1) 差别具有“显著性”指差别具有“统计学意义”; 2) 具有“统计学意义”不一定具有“专业意义” 5、正确理解“显著性”、“统计学意义”与“专业意义” 1) 差别具有“显著性”指差别具有“统计学意义”; 2) 具有“统计学意义”不一定具有“专业意义”

差别有统计学意义,过去称差别有“显著性”,不能理解为两者差异大,也不能理解为所分析的指标在实际应用上就有“显著效果”或“显著价值”。

如用某种降压药后舒张压平均下降0.1kPa,经t检验后可能得到p<α,由此作出的“用药前后的差异有统计学意义”的结论并不意味此药就有“显著疗效”或在临床上有“显著应用价值”,

它仅表明用药前后的差异不大可能仅仅是偶然巧遇而出现的,事实上0.1kPa的差值并无实际意义(有临床意义的差值应≥0.67kPa)。

假设检验的结果只能反映两者的差异是否由抽样误差引起,而差异的大小及是否具有实际价值只能根据专业知识予以确定。

小结 1.t检验和Z检验应用条件 2.两类错误 3.假设检验注意事项

练习

Exercise

为观察辛伐他汀治疗糖尿病高胆固醇血症的疗效,将100名2型糖尿病合并高血脂症患者随机分为两组,两组均在控制饮食及运动治疗的基础上,对照组54例给予格列喹酮片加二甲双胍片,治疗组46例另加服辛伐他汀片。结果:对照组TC降低0.35mmol/L,治疗组降低0.49mmol/L,经治疗前后配对t检验和两组差值的两样本t检验后均得P<0.05.由此研究者认为两组血糖下降同时TC下降明显,治疗组降糖同时加用辛伐他汀后降低TC较对照组更显著,故对于合并高血脂症的糖尿病患者应积极给予降脂治疗

问题 1.该资料属于何种设计方案? 2.该作者的结论是否正确?为什么? 答案:1.完全随机和自身配对 2.不正确,临床有实际意义差值不小于0.52mmol/L