第六章 假设检验基础.

Slides:



Advertisements
Similar presentations
第五节 函数的微分 一、微分的定义 二、微分的几何意义 三、基本初等函数的微分公式与微分运算 法则 四、微分形式不变性 五、微分在近似计算中的应用 六、小结.
Advertisements

2.8 函数的微分 1 微分的定义 2 微分的几何意义 3 微分公式与微分运算法则 4 微分在近似计算中的应用.
全微分 教学目的:全微分的有关概念和意义 教学重点:全微分的计算和应用 教学难点:全微分应用于近似计算.
练一练: 在数轴上画出表示下列各数的点, 并指出这些点相互间的关系: -6 , 6 , -3 , 3 , -1.5, 1.5.
第八章 X2 检验 卫生(医学)统计学 普通高等教育 “ 十一五 ” 国家级规划教材. X 2 检验用途 1 、推断两个或两个以上的总体率或总体构 成比 之间有无差别; 2 、推断两种属性或两个变量之间有无关联 性; 3 、频数分布的拟合优度检验。
7.1 假设检验 1. 假设检验的基本原理 2. 假设检验的相关概念 3. 假设检验的一般步骤 4. 典型例题 5. 小结.
第十七章 分类资料的统计推断.
第四章 假设检验 第4.1节 假设检验的基本概念 第4.2节 正态总体均值与方差 的假设检验 第4.3节 非参数假设检验方法
第十二章 非参数检验 (Nonparametric test)
第六章 假设检验 主讲教师:王丽艳 徐栋.
教材版本:新教材人教版九年级(上) 作品名称:同类二次根式 主讲老师:张翀 所在单位:珠海市平沙第一中学.
第六章 方差分析 (Analysis of Variance,ANOVA)
证券投资技术分析.
6.6 单侧置信限 1、问题的引入 2、基本概念 3、典型例题 4、小结.
完全随机设计多样本资料秩和检验.
第 8 章 假设检验 作者:中国人民大学统计学院 贾俊平 PowerPoint 统计学.
计数资料的统计推断 (2 学时) 吴成秋 公共卫生学院预防医学系
Distribution and Application of Discrete Variable
四种命题 2 垂直.
常用逻辑用语复习课 李娟.
§6.3 假设检验的基本概念 我们将讨论不同于参数估计的另一类重要的统计推断问题. 这就是根据样本的信息检验关于总体的某个假设是否正确.
第 八 章 t 检 验.
第八章 假设检验 本章重点: 1、正确建立零假设和备择假设 2、理解第一类错误和第二类错误 3、大样本情况下单个总体的假设检验
§5.3 定积分的换元法 和分部积分法 一、 定积分的换元法 二、 定积分的分部积分法 三、 小结、作业.
第三篇 医学统计学方法. 第三篇 医学统计学方法 医学统计学方法 实习2 主讲人 陶育纯 医学统计学方法 实习2 主讲人 陶育纯 流行病与卫生统计学教研室
本讲义可在网址 或 ftp://math.shekou.com 下载
不确定度的传递与合成 间接测量结果不确定度的评估
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
问:图中∠α与∠β的度数之间有怎样的关系?
第四章 抽样误差与假设检验 要求: 掌握:均数的抽样误差与标准误,t分 布的特征,t界值表,总体均数可信区间及其与参考值范围的区别。
第三篇 医学统计学方法. 第三篇 医学统计学方法 医学统计学方法 3 主讲人 陶育纯 医学统计分析 医学统计学方法.
成组设计两样本均数的比较 赵耐青 卫生统计教研室.
区间估计 Interval Estimation.
第11章 秩转换的非参数检验 (nonparametric test).
t 检验——问题提出 假设检验是通过两组或多组的样本统计量的差别或样本统计量与总体参数的差异来推断他们相应的总体参数是否相同;
第6章 统计量及其抽样分布 统计量 关于分布的几个概念 由正态分布导出的几个重要分布 样本均值的分布与中心极限定理 样本比例的抽样分布
第三章 多维随机变量及其分布 §2 边缘分布 边缘分布函数 边缘分布律 边缘概率密度.
例1 :甲击中的环数; X :乙击中的环数; Y 平较高? 试问哪一个人的射击水 : 的射击水平由下表给出 甲、乙两人射击,他们
第十章 方差分析.
数据统计与分析 秦 猛 南京大学物理系 手机: 第十讲 数据统计与分析 秦 猛 南京大学物理系 办公室:唐仲英楼A 手机:
第七章 参数估计 7.3 参数的区间估计.
习题 一、概率论 1.已知随机事件A,B,C满足 在下列三种情况下,计算 (1)A,B,C相互独立 (2)A,B独立,A,C互不相容
抽样和抽样分布 基本计算 Sampling & Sampling distribution
模型分类问题 Presented by 刘婷婷 苏琬琳.
概 率 统 计 主讲教师 叶宏 山东大学数学院.
5.2 常用统计分布 一、常见分布 二、概率分布的分位数 三、小结.
完全随机设计多组资料的比较 赵耐青 卫生统计教研室.
1.2 有理数 第1课时 有理数 伏家营中学 付宝华.
成绩是怎么算出来的? 16级第一学期半期考试成绩 班级 姓名 语文 数学 英语 政治 历史 地理 物理 化学 生物 总分 1 张三1 115
相关与回归 非确定关系 在宏观上存在关系,但并未精确到可以用函数关系来表达。青少年身高与年龄,体重与体表面积 非确定关系:
四、标准加入法 (Q=0) 序 号 测定液浓度 c c c 测定液体积 V V V 标液浓度 cS cS cS
概 率 统 计 主讲教师 叶宏 山东大学数学院.
第4课时 绝对值.
海报题目 简介: 介绍此项仿真工作的目标和需要解决的问题。 可以添加合适的图片。
第四节 多个样本均数的两两比较 多个样本均数的两两比较又称多重比较(multiple comparison),其目的是推断究竟哪些总体均数之间存在差别。
第15讲 特征值与特征向量的性质 主要内容:特征值与特征向量的性质.
§5.2 抽样分布   确定统计量的分布——抽样分布,是数理统计的基本问题之一.采用求随机向量的函数的分布的方法可得到抽样分布.由于样本容量一般不止2或 3(甚至还可能是随机的),故计算往往很复杂,有时还需要特殊技巧或特殊工具.   由于正态总体是最常见的总体,故本节介绍的几个抽样分布均对正态总体而言.
第三节 随机区组设计的方差分析 随机区组设计资料的总平方和可以分解为三项: (10.10).
Statistical Methods in Medicine
第十五讲 区间估计 本次课讲完区间估计并开始讲授假设检验部分 下次课结束假设检验,并进行全书复习 本次课程后完成作业的后两部分
第八章 假设检验 8.3 两个正态总体参数的假设检验.
Sampling Error and Hypothesis Test
单样本检验.
第四节 向量的乘积 一、两向量的数量积 二、两向量的向量积.
二、配对样本t检验 配对设计(paired design)定义:将受试对象按某些重要特征相近的原则配成对子,每对中的两个个体随机地给予两种处理,称为随机配对设计。
一元一次方程的解法(-).
假设检验.
海报题目 简介: 介绍此项仿真工作的目标和需要解决的问题。 可以添加合适的图片。
Presentation transcript:

第六章 假设检验基础

假设检验的概念与原理 假设检验的思维逻辑 某商家宣称他的一大批鸡蛋“坏(变质)蛋率为1%”。对这批鸡蛋的质量(即“坏蛋率为1%”还是“坏蛋率高于1%”)做出判断, 在“坏蛋率为1%”的前提下,5个鸡蛋样品中出现一个“坏蛋”的机会是很小的,“小概率事件在一次随机试验中不(大)可能发生”的。 本章将要介绍的假设检验理论和方法,正是基于这一思维判断形式而发展出来的依据随机样本对于未知事物进行判断和决策的规则。应用假设检验理论和方法,依据样本提供的有限信息对总体做推断。

假设检验的基本步骤 例6-1 已知北方农村儿童前囟门闭合月龄为14.1月。某研究人员从东北某县抽取36名儿童,得囟门闭合月龄均值为14.3月,标准差为5.08月。问该县儿童前囟门闭合月龄的均数是否大于一般儿童?

假设检验的步骤: 1.选择检验方法,建立检验假设并确定检验水准 H0:μ=14.1(月),总体上该县儿童前囟门闭合月龄的平均水平与一般儿童的平均水平相同 H1 : μ>14.1(月),该县儿童前囟门闭合月龄的平均水平高于一般儿童的平均水平 检验水准(size of a test) α=0.05 或0.01

2.计算统计量 t检验的统计量t 自由度:

3.确定P值 P值的意义是: 如果总体状况和H0一致,统计量获得现有数值以及更不利于H0的数值的可能性(概率)有多大? 自由度为35 ,查附表2,得到: 单侧 。 得知P>0.5。

如果P值大于α,在H0成立的假设下发生较为可能的事件,没有充足的理由对H0提出怀疑。于是做出不拒绝H0的决策。 如果P值小于或等于检验水准α,意味着在H0成立的前提下发生了小概率事件,根据“小概率事件在一次随机试验中不(大)可能发生”的推断原理,怀疑H0的真实性,从而做出拒绝(reject) H0的决策。因为H0与H1是对立的,既然拒绝H0 ,就只能接受H1 。 如果P值大于α,在H0成立的假设下发生较为可能的事件,没有充足的理由对H0提出怀疑。于是做出不拒绝H0的决策。

由于P>0. 5,自然有P>0. 05(即α)。这意味着,如果该县儿童前囟门闭合的平均月龄为14. 1月,观察到囟门闭合月龄均值为14 由于P>0.5,自然有P>0.05(即α)。这意味着,如果该县儿童前囟门闭合的平均月龄为14.1月,观察到囟门闭合月龄均值为14.3月的样本(以及均值更大的样本)的可能性还是比较大的(概率大于0.5);没有理由对H0提出怀疑,于是做出不拒绝H0的推断结论。 无论做出哪一种推断结论(接受或是拒绝H0 ),都面临着发生判断错误的风险。这就是假设检验的两类错误

图6-1 假设检验示意图

t检验 一组样本资料的t检验 检验假设 H0 :μ=μ0, H1 :μ≠μ0(单侧检验μ>μ0或μ<μ0) 统计量: 见例6-1

配对设计资料的t检验 实施的形式主要有: (1)将受试对象配成特征(主要非处理因素)相近的对子,同对的两个受试对象随机分别接受不同处理; (2)同一样品分成两份,随机分别接受不同处理(或测量)。

检验假设为 H0 :μd= 0, H1 :μd≠0 当成立时,检验统计量

例6-2 某儿科采用静脉注射人血丙种球蛋白治疗小儿急性毛细支气管炎。用药前后患儿血清中免疫球蛋白IgG(mg/dl)含量如­表6-1所示。试问用药前后IgG有无变化?

表6-1 用药前后患儿血清中免疫球蛋白IgG(mg/dl)含量   表6-1 用药前后患儿血清中免疫球蛋白IgG(mg/dl)含量 序号 用药前 用药后 差值(=用药后含量-用药前含量) 1 2 3 4 5 6 1206.44 921.69 1294.08 945.36 721.36 692.32 1678.44 1293.36 1711.66 1416.70 1204.55 1147.30 472.00 371.67 417.58 471.34 483.19 454.97 7 980.01 1379.59 399.58 8 691.01 1091.46 400.45 9 910.39 1360.34 449.95 10 568.56 1091.83 523.27 11 1105.52 1728.03 622.51 12 757.43 1398.86 641.44

检验假设 H0:μd= 0, H1:μd≠0 α=0.05 n=12, Σd=5707.95, =Σd/n=5707.95/12=475.66 ∑d2=2793182.166

计算统计量 (mg/dl), ν=n-1=12-1=11

查附表2(t临界值表), t0.05,11=2.201,得P<0.05, 在α=0.05的水准上拒绝H0,可以认为用药后小儿IgG增高。

例6-3 用两种方法测定12份血清样品中Mg2+ 含量(mmol/l)的结果见表6-2。试问两种方法测定结果有无差异? 检验假设 H0:μd= 0, H1:μd≠0 α=0.05 n=12, , Sd={[0.026-(-0.04)2/12]/(12-1)}1/2=0.01497

表6-2 两种方法测定血清Mg2+ (mmol/l)的结果 试样号 甲基百里酚蓝(MTB)法 葡萄糖激酶两点法 差值 1 0.94 0.92 -0.02 2 1.02 1.01 -0.01 3 1.14 1.11 -0.03 4 1.23 1.22 5 1.31 1.32 0.01 6 1.41 1.42 7 1.53 1.51 8 1.61 9 1.72 10 1.81 1.82 11 1.93 12 2.02 2.04 0.02

计算统计量: 自由度 ν=n-1=12-1=11. 查附表2(t临界值表),双侧 t0.20,11 = 1.363,知P>0.20,在α=0.05水平上不能拒绝H0。所以尚不能认为两法测定结果不同。

两组独立样本资料的t检验 将受试对象随机分配成两个处理组,每一组随机接受的一种处理。一般把这样获得的两组资料视为代表两个不同总体的两份样本,据以推断它们的总体均数是否相等。 在实际工作中按完全随机设计的两样本比较来对待。此类比较分为两种情况。

两样本所属总体方差相等 检验假设为 H0:μ1=μ2, H1:μ1≠μ2 已知当H0成立时,检验统计量 自由度=n1+n2-2

合并方差 : 例6-4 某口腔科测得长春市13-16岁居民男性20人的恒牙初期腭弓深度均值为17.15mm, 标准差为1.59mm; 女性34人的均值为16.92mm,标准差为1.42mm。根据这份数据可否认为该市13-16岁居民腭弓深度有性别差异?

检验假设 H0:μ1=μ2 (男性与女性腭弓深度相同) H1:μ1≠μ2 (男性与女性腭弓深度不同) α=0.05 这里n1=20, mm, S1=1.59mm, n2=34, mm, S2=1.42mm。

自由度 ν=n1+n2-2=20+34-2=52 查附表2(t临界值表), t0.5,50=0.679, 知P>0.5,在α=0.05水准上尚不能拒绝H0。所以还不能认为该市13-16岁居民腭弓深度有性别差异。

两样本所属总体方差不等(Satterthwaite近似法) 检验假设为 H0:μ1=μ2, H1:μ1≠μ2 采用(6-5)式的统计量t’作检验。

自由度

例6-5 为探讨硫酸氧钒对糖尿病性白内障的防治作用,研究人员将已诱导糖尿病模型的20只大鼠随机分为两组。一组用硫酸氧钒治疗(DV组),另一组作对照观察(D组),12周后测大鼠血糖含量(mmol/L)。结果为,DV组12只,样本均数为6.5mmol/L,标准差为1.34mmol/L;D组8只,样本均数为13.7mmol/L,标准差为4.21mmol/L。试问两组动物血糖含量的总体均数是否相同?

检验假设 H0:μ1=μ2, H1:μ1≠μ2 α=0.05

查附表2(t临界值表),得 ,知P<0. 05, 在α=0 查附表2(t临界值表),得 ,知P<0.05, 在α=0.05水平上拒绝H0。所以可认为经硫酸氧钒治疗的大鼠与未治疗大鼠的血糖含量不同。

两组独立样本资料的方差齐性检验 H0:, H1: ν1=n1-1,ν2=n2-1

例6-6 试检验例6-5 中两组(DV组与D组)大鼠接受相应处理12周后测得的血糖含量(mmol/L)是否具有方差齐性? 查附表3.2,F0.05(7,11)=3.76, 知P<0.05,在α=0.05水平上拒绝H0。可以认为两个总体方差不相等。

二项分布与Poisson分布资料Z检验 二项分布资料的Z检验 (一)一组样本资料的Z检验 X ~N(nπ, nπ(1-π)) P~

检验假设 H0:π=π0, H1:π≠π0 检验统计量

当n不太大时, 需作如下的连续性校正,

例6-8 某医院称治疗声带白斑的有效率为80%。今统计前来求医的此类患者60例,其中45例治疗有效。试问该医院宣称的疗效是否客观? 1.      建立检验假设 H0:π= 0.80, H1:π<0.80 α=0.05

计算统计量 确定P值和作统计推断 按ν=∞查附表2(t临界值表),得(单侧)Z0.10=1.2816,知P>0.10。在α=0.05水准上不能拒绝H0。可以认为该医院宣称的有效率尚属客观。

两组独立样本资料的Z检验 H0:π1=π2, H1:π1≠π2 统计量

例6-9 用硝苯吡啶治疗高血压急症患者75例,有效者57例;用硝苯吡啶﹢卡托普利治疗同类患者69例,66例有效。试问两疗法的有效率是否相同? 建立检验假设 H0:π1=π2, H1:π1≠π2 α=0.05

计算统计量 p1=57/75=0.76,p2=66/69=0.95652, 确定P值和作推断 Z0.001/2=3.2905,所以P<0.001,在α=0.05水准上拒绝H0。可以认为两种疗法有效率不同。

Poisson分布资料的Z检验 当总体均数λ≥20时,依据Poisson分布近似正态分布的原理,可以对其总体均数进行推断。

检验假设 H0:λ=λ0, H1:λ≠λ0 检验统计量为

例6-10 某地十年前计划到2000年把孕产妇死亡率降到25/10万以下。2000年监测资料显示,该地区平均而言,每10万例活产儿孕产妇死亡31人。问该地区降低孕产妇死亡的目标是否到达到? 建立检验假设 H0:λ=25, H1:λ>25 α=0.05

计算统计量 按(6-13)式 确定P值和作推断 Z0.10=1.2816,知P>0.10,按α=0.05水准,尚不能拒绝H0。可以认为该地区达到了预定目标。

两组独立样本资料的Z检验 当两总体均数都大于20时,依据Poisson分布近似正态分布的原理,可以应用Z检验对其总体均数进行推断。 检验假设H0:λ1=λ2, H1:λ1≠λ2

当两样本观测单位数相等时,检验统计量为 两样本观测单位数不等时,检验统计量

例6-11 甲、乙两检验师分别观察15名正常人末梢血嗜碱性白细胞数量。每张血片均观察200个视野。结果甲计数到嗜碱性白细胞26个,乙计数到29个。试问两位检验师检查结果是否一致? 建立检验假设 H0:λ1=λ2 , H1:λ1≠λ2 α=0.05

计算统计量 按(6-14)式 确定P值和作推断 按ν=∞查附表2(t临界值表),知Z0.5/2=0.6745,所以P>0.5,按α=0.05水准不能拒绝H0。尚不能认为两检验师检查结果有差异。

例6-12 某车间改革生产工艺前,测得三次粉尘浓度,每升空气中分别有38、29、36颗粉尘;改进工艺后,测取两次,分别为25、18颗粉尘。问工艺改革前后粉尘数有无差别? 1.建立检验假设 H0:λ1=λ2 , H1:λ1≠λ2 α=0.05

计算统计量 因工艺改革前后观测单位数不等,故分别计算其均数。 , n1=3 , n2=2 Z=2.723>1.96,P<0.05,在α=0.05的水平上拒绝H0。可以认为工艺改革前后粉尘浓度不同,改革工艺后粉尘浓度较低。

假设检验与区间估计的关系 置信区间具有假设检验的主要功能 显然,H0: 不在此区间之内。这与按照α=0.05水准拒绝H0的推断结论是等价的。

单侧检验 结合例6-1的资料,对东北某县农村儿童前囟门闭合月龄总体均数μ的95%单侧置信区间的下限为 可以看到,H0: 被包含在区间(12.869,∞)之内,所以不能拒绝H0。这与假设检验的结论也等价的。

置信区间可提供假设检验没有提供的信息 置信区间在回答差别有无统计学意义的同时,还可以提示差别是否具有实际意义在图6-2中,置信区间(1)~(3)均不包含原假设H0,意味着相应的差异具有统计学意义。(1)还提示差异具有实际意义;(2)提示可能具有实际意义;(3)提示实际意义不大。图中的(4)与(5)均无统计学意义,但(4)提示样本量不足。(5)属于可以接受原假设的情况。

假设检验提供,而置信区间不提供的信息

假设检验的功效 假设检验的两类错误 第Ⅰ类错误:拒绝原本正确的H0,导致推断结论错误。

实际情况 检验结果 H0真 第Ⅰ类错误 (α) 结论正确(1-α) H0 不真 结论正确 (1-β) 第Ⅱ类错误(β) 表6-3 推断结论和两类错误 实际情况 检验结果 拒绝H0 不拒绝H0 H0真 第Ⅰ类错误 (α) 结论正确(1-α) H0 不真 结论正确 (1-β) 第Ⅱ类错误(β)

假设检验的功效 1-β称为假设检验的功效(power of a test)。其意义是,当所研究的总体与H0确有差别时,按检验水平α能够发现它(拒绝H0)的概率。如果1-β=0.90,则意味着当H0不成立时,理论上在每100次抽样中,在α的检验水准上平均有90次能拒绝H0。一般情况下对同一检验水准α,功效大的检验方法更可取

一组样本资料t检验的功效

例6-14 计算例6-1检验的功效1-β。 假定根据现有知识可以取σ=5月,δ=0.5月,。 由标准正态分布表查这个数值所对应的上侧尾部面积, 得到β=0.8531,于是, 1-β=0.1469。说明例6-1的检验功效太小,即发现δ=0.5个月的差别的机会只有14.69% 。

两组独立样本资料t检验的功效

例6-15 试计算例6-5中检验的功效。 假定根据现有知识可以取δ=1mm, σ=1.5mm, . n1=20, n2=34。 由标准正态分布表查这个数值所对应的上侧尾部面积, 得到β=0.3228,于是1-β=0.6772。

二项分布两组独立样本资料Z检验的功效

例6-16 试计算例6-9中检验的功效。 假定根据现有知识可以取δ=0.15,π1=0.76,π2=0.96, =1.547 由标准正态分布表查这个数值所对应的上侧尾部面积, 得到β=0.0594,于是1-β=0.9406。

应用假设检验需要注意的问题 ★在抽样研究中,研究设计、搜集数据和统计分析是一个整体。每一种假设检验方法都是与相应的研究设计相联系的 ★应用检验方法必需符合其适用条件 ★当样本量一定时,第Ⅰ类错误的概率α变小,第Ⅱ类错误的概率β就变大。 ★正确理解P值的意义。