第六章假设检验基础.

Slides:

Advertisements

Similar presentations

第五节函数的微分一、微分的定义二、微分的几何意义三、基本初等函数的微分公式与微分运算法则四、微分形式不变性五、微分在近似计算中的应用六、小结.

Advertisements

2.8 函数的微分 1 微分的定义 2 微分的几何意义 3 微分公式与微分运算法则 4 微分在近似计算中的应用.

全微分教学目的：全微分的有关概念和意义教学重点：全微分的计算和应用教学难点：全微分应用于近似计算.

练一练：在数轴上画出表示下列各数的点，并指出这些点相互间的关系： -6 ， 6 ， -3 ， 3 ， -1.5, 1.5.

第八章 X2 检验卫生（医学）统计学普通高等教育 “ 十一五 ” 国家级规划教材. Ｘ 2 检验用途 1 、推断两个或两个以上的总体率或总体构成比之间有无差别； 2 、推断两种属性或两个变量之间有无关联性； 3 、频数分布的拟合优度检验。

7.1 假设检验 1. 假设检验的基本原理 2. 假设检验的相关概念 3. 假设检验的一般步骤 4. 典型例题 5. 小结.

第十七章分类资料的统计推断.

第四章假设检验第4.1节假设检验的基本概念第4.2节正态总体均值与方差的假设检验第4.3节非参数假设检验方法

第十二章非参数检验（Nonparametric test）

第六章假设检验主讲教师：王丽艳徐栋.

教材版本：新教材人教版九年级（上）作品名称：同类二次根式主讲老师：张翀所在单位：珠海市平沙第一中学.

第六章方差分析（Analysis of Variance，ANOVA）

证券投资技术分析.

6.6 单侧置信限 1、问题的引入 2、基本概念 3、典型例题 4、小结.

完全随机设计多样本资料秩和检验.

第 8 章假设检验作者：中国人民大学统计学院贾俊平 PowerPoint 统计学.

计数资料的统计推断（2 学时）吴成秋公共卫生学院预防医学系

Distribution and Application of Discrete Variable

四种命题 2 垂直.

常用逻辑用语复习课李娟.

§6.3 假设检验的基本概念我们将讨论不同于参数估计的另一类重要的统计推断问题. 这就是根据样本的信息检验关于总体的某个假设是否正确.

第八章 t 检验.

第八章假设检验本章重点： 1、正确建立零假设和备择假设 2、理解第一类错误和第二类错误 3、大样本情况下单个总体的假设检验

§5.3 定积分的换元法和分部积分法一、定积分的换元法二、定积分的分部积分法三、小结、作业.

第三篇医学统计学方法. 第三篇医学统计学方法医学统计学方法实习2 主讲人陶育纯医学统计学方法实习2 主讲人陶育纯流行病与卫生统计学教研室

本讲义可在网址或 ftp://math.shekou.com 下载

不确定度的传递与合成间接测量结果不确定度的评估

§5 微分及其应用一、微分的概念实例:正方形金属薄片受热后面积的改变量..

§5 微分及其应用一、微分的概念实例:正方形金属薄片受热后面积的改变量..

问：图中∠α与∠β的度数之间有怎样的关系？

第四章抽样误差与假设检验要求：掌握：均数的抽样误差与标准误，t分布的特征，t界值表，总体均数可信区间及其与参考值范围的区别。

第三篇医学统计学方法. 第三篇医学统计学方法医学统计学方法 3 主讲人陶育纯医学统计分析医学统计学方法.

成组设计两样本均数的比较赵耐青卫生统计教研室.

区间估计 Interval Estimation.

第11章秩转换的非参数检验（nonparametric test）.

t 检验——问题提出假设检验是通过两组或多组的样本统计量的差别或样本统计量与总体参数的差异来推断他们相应的总体参数是否相同；

第6章统计量及其抽样分布统计量关于分布的几个概念由正态分布导出的几个重要分布样本均值的分布与中心极限定理样本比例的抽样分布

第三章多维随机变量及其分布 §2 边缘分布边缘分布函数边缘分布律边缘概率密度.

例1 ：甲击中的环数； X ：乙击中的环数； Y 平较高？试问哪一个人的射击水：的射击水平由下表给出甲、乙两人射击，他们

第十章方差分析.

数据统计与分析秦猛南京大学物理系手机：第十讲数据统计与分析秦猛南京大学物理系办公室：唐仲英楼A 手机：

第七章参数估计 7.3 参数的区间估计.

习题一、概率论 1.已知随机事件A，B，C满足在下列三种情况下，计算（1）A，B，C相互独立（2）A，B独立，A，C互不相容

抽样和抽样分布基本计算 Sampling & Sampling distribution

模型分类问题 Presented by 刘婷婷苏琬琳.

概率统计主讲教师叶宏山东大学数学院.

5.2 常用统计分布一、常见分布二、概率分布的分位数三、小结.

完全随机设计多组资料的比较赵耐青卫生统计教研室.

1.2 有理数第1课时有理数伏家营中学付宝华.

成绩是怎么算出来的？ 16级第一学期半期考试成绩班级姓名语文数学英语政治历史地理物理化学生物总分 1 张三1 115

相关与回归非确定关系在宏观上存在关系，但并未精确到可以用函数关系来表达。青少年身高与年龄，体重与体表面积非确定关系：

四、标准加入法（Q=0）序号测定液浓度 c c c 测定液体积 V V V 标液浓度 cS cS cS

概率统计主讲教师叶宏山东大学数学院.

第4课时绝对值.

海报题目简介: 介绍此项仿真工作的目标和需要解决的问题。可以添加合适的图片。

第四节多个样本均数的两两比较多个样本均数的两两比较又称多重比较(multiple comparison)，其目的是推断究竟哪些总体均数之间存在差别。

第15讲特征值与特征向量的性质主要内容：特征值与特征向量的性质.

§5.2 抽样分布　　确定统计量的分布——抽样分布，是数理统计的基本问题之一．采用求随机向量的函数的分布的方法可得到抽样分布．由于样本容量一般不止2或 3(甚至还可能是随机的)，故计算往往很复杂，有时还需要特殊技巧或特殊工具．　　由于正态总体是最常见的总体，故本节介绍的几个抽样分布均对正态总体而言．

第三节随机区组设计的方差分析随机区组设计资料的总平方和可以分解为三项：（10.10）.

Statistical Methods in Medicine

第十五讲区间估计本次课讲完区间估计并开始讲授假设检验部分下次课结束假设检验，并进行全书复习本次课程后完成作业的后两部分

第八章假设检验 8.3 两个正态总体参数的假设检验.

Sampling Error and Hypothesis Test

单样本检验.

第四节向量的乘积一、两向量的数量积二、两向量的向量积.

二、配对样本t检验配对设计(paired design)定义:将受试对象按某些重要特征相近的原则配成对子，每对中的两个个体随机地给予两种处理，称为随机配对设计。

一元一次方程的解法(－).

海报题目简介: 介绍此项仿真工作的目标和需要解决的问题。可以添加合适的图片。

Presentation transcript:

第六章假设检验基础

假设检验的概念与原理假设检验的思维逻辑某商家宣称他的一大批鸡蛋“坏（变质）蛋率为1%”。对这批鸡蛋的质量（即“坏蛋率为1%”还是“坏蛋率高于1%”）做出判断，在“坏蛋率为1%”的前提下，5个鸡蛋样品中出现一个“坏蛋”的机会是很小的，“小概率事件在一次随机试验中不（大）可能发生”的。本章将要介绍的假设检验理论和方法，正是基于这一思维判断形式而发展出来的依据随机样本对于未知事物进行判断和决策的规则。应用假设检验理论和方法，依据样本提供的有限信息对总体做推断。

假设检验的基本步骤例6-1 已知北方农村儿童前囟门闭合月龄为14.1月。某研究人员从东北某县抽取36名儿童，得囟门闭合月龄均值为14.3月，标准差为5.08月。问该县儿童前囟门闭合月龄的均数是否大于一般儿童？

假设检验的步骤： 1.选择检验方法，建立检验假设并确定检验水准 H0：μ=14.1（月），总体上该县儿童前囟门闭合月龄的平均水平与一般儿童的平均水平相同 H1 ： μ>14.1（月），该县儿童前囟门闭合月龄的平均水平高于一般儿童的平均水平检验水准（size of a test） α=0.05 或0.01

2.计算统计量 t检验的统计量t 自由度:

3.确定P值 P值的意义是: 如果总体状况和H0一致，统计量获得现有数值以及更不利于H0的数值的可能性（概率）有多大？自由度为35 ,查附表2,得到: 单侧。得知P>0.5。

如果P值大于α，在H0成立的假设下发生较为可能的事件，没有充足的理由对H0提出怀疑。于是做出不拒绝H0的决策。如果P值小于或等于检验水准α，意味着在H0成立的前提下发生了小概率事件，根据“小概率事件在一次随机试验中不（大）可能发生”的推断原理，怀疑H0的真实性，从而做出拒绝（reject） H0的决策。因为H0与H1是对立的，既然拒绝H0 ，就只能接受H1 。如果P值大于α，在H0成立的假设下发生较为可能的事件，没有充足的理由对H0提出怀疑。于是做出不拒绝H0的决策。

由于P＞0. 5，自然有P＞0. 05（即α）。这意味着，如果该县儿童前囟门闭合的平均月龄为14. 1月，观察到囟门闭合月龄均值为14 由于P＞0.5，自然有P＞0.05（即α）。这意味着，如果该县儿童前囟门闭合的平均月龄为14.1月，观察到囟门闭合月龄均值为14.3月的样本（以及均值更大的样本）的可能性还是比较大的（概率大于0.5）；没有理由对H0提出怀疑，于是做出不拒绝H0的推断结论。无论做出哪一种推断结论（接受或是拒绝H0 ），都面临着发生判断错误的风险。这就是假设检验的两类错误

图6-1 假设检验示意图

t检验一组样本资料的t检验检验假设 H0 ：μ=μ0， H1 ：μ≠μ0（单侧检验μ>μ0或μ<μ0）统计量: 见例6-1

配对设计资料的t检验实施的形式主要有： (1)将受试对象配成特征（主要非处理因素）相近的对子，同对的两个受试对象随机分别接受不同处理； (2)同一样品分成两份，随机分别接受不同处理（或测量）。

检验假设为 H0 :μd= 0， H1 :μd≠0 当成立时，检验统计量

例6-2 某儿科采用静脉注射人血丙种球蛋白治疗小儿急性毛细支气管炎。用药前后患儿血清中免疫球蛋白IgG（mg/dl）含量如表6-1所示。试问用药前后IgG有无变化？

表6-1 用药前后患儿血清中免疫球蛋白IgG（mg/dl）含量表6-1 用药前后患儿血清中免疫球蛋白IgG（mg/dl）含量序号用药前用药后差值（=用药后含量-用药前含量） 1 2 3 4 5 6 1206.44 921.69 1294.08 945.36 721.36 692.32 1678.44 1293.36 1711.66 1416.70 1204.55 1147.30 472.00 371.67 417.58 471.34 483.19 454.97 7 980.01 1379.59 399.58 8 691.01 1091.46 400.45 9 910.39 1360.34 449.95 10 568.56 1091.83 523.27 11 1105.52 1728.03 622.51 12 757.43 1398.86 641.44

检验假设 H0:μd= 0， H1:μd≠0 α=0.05 n=12， Σd=5707.95， =Σd/n=5707.95/12=475.66 ∑d2=2793182.166

计算统计量 (mg/dl)， ν=n-1=12-1=11

查附表2（t临界值表）， t0.05，11=2.201，得P<0.05，在α=0.05的水准上拒绝H0，可以认为用药后小儿IgG增高。

例6-3 用两种方法测定12份血清样品中Mg2+ 含量（mmol/l）的结果见表6-2。试问两种方法测定结果有无差异？检验假设 H0:μd= 0， H1:μd≠0 α=0.05 n=12，， Sd={[0.026-(-0.04)2/12]/(12-1)}1/2=0.01497

表6-2 两种方法测定血清Mg2+ （mmol/l）的结果试样号甲基百里酚蓝（MTB）法葡萄糖激酶两点法差值 1 0.94 0.92 -0.02 2 1.02 1.01 -0.01 3 1.14 1.11 -0.03 4 1.23 1.22 5 1.31 1.32 0.01 6 1.41 1.42 7 1.53 1.51 8 1.61 9 1.72 10 1.81 1.82 11 1.93 12 2.02 2.04 0.02

计算统计量: 自由度 ν=n-1=12-1=11. 查附表2（t临界值表），双侧 t0.20,11 = 1.363，知P>0.20，在α=0.05水平上不能拒绝H0。所以尚不能认为两法测定结果不同。

两组独立样本资料的t检验将受试对象随机分配成两个处理组，每一组随机接受的一种处理。一般把这样获得的两组资料视为代表两个不同总体的两份样本，据以推断它们的总体均数是否相等。在实际工作中按完全随机设计的两样本比较来对待。此类比较分为两种情况。

两样本所属总体方差相等检验假设为 H0:μ1=μ2， H1:μ1≠μ2 已知当H0成立时，检验统计量自由度=n1+n2-2

合并方差 : 例6-4 某口腔科测得长春市13-16岁居民男性20人的恒牙初期腭弓深度均值为17.15mm，标准差为1.59mm；女性34人的均值为16.92mm，标准差为1.42mm。根据这份数据可否认为该市13-16岁居民腭弓深度有性别差异？

检验假设 H0:μ1=μ2 (男性与女性腭弓深度相同） H1:μ1≠μ2 （男性与女性腭弓深度不同) α=0.05 这里n1=20, mm, S1=1.59mm， n2=34, mm, S2=1.42mm。

自由度 ν=n1+n2-2=20+34-2=52 查附表2（t临界值表）， t0.5,50=0.679, 知P>0.5,在α=0.05水准上尚不能拒绝H0。所以还不能认为该市13-16岁居民腭弓深度有性别差异。

两样本所属总体方差不等（Satterthwaite近似法）检验假设为 H0:μ1=μ2， H1:μ1≠μ2 采用(6-5)式的统计量t’作检验。

自由度

例6-5 为探讨硫酸氧钒对糖尿病性白内障的防治作用，研究人员将已诱导糖尿病模型的20只大鼠随机分为两组。一组用硫酸氧钒治疗(DV组)，另一组作对照观察(D组)，12周后测大鼠血糖含量（mmol/L）。结果为，DV组12只，样本均数为6.5mmol/L,标准差为1.34mmol/L；D组8只，样本均数为13.7mmol/L,标准差为4.21mmol/L。试问两组动物血糖含量的总体均数是否相同？

检验假设 H0:μ1=μ2， H1:μ1≠μ2 α=0.05

查附表2（t临界值表），得 ,知P<0. 05, 在α=0 查附表2（t临界值表），得 ,知P<0.05, 在α=0.05水平上拒绝H0。所以可认为经硫酸氧钒治疗的大鼠与未治疗大鼠的血糖含量不同。

两组独立样本资料的方差齐性检验 H0:, H1: ν1=n1-1，ν2=n2-1

例6-6 试检验例6-5 中两组（DV组与D组）大鼠接受相应处理12周后测得的血糖含量（mmol/L）是否具有方差齐性？查附表3.2，F0.05(7,11)=3.76, 知P<0.05，在α=0.05水平上拒绝H0。可以认为两个总体方差不相等。

二项分布与Poisson分布资料Z检验二项分布资料的Z检验（一）一组样本资料的Z检验 X ～N(nπ, nπ(1-π)) P~

检验假设 H0：π=π0， H1：π≠π0 检验统计量

当n不太大时, 需作如下的连续性校正,

例6-8 某医院称治疗声带白斑的有效率为80%。今统计前来求医的此类患者60例，其中45例治疗有效。试问该医院宣称的疗效是否客观？ 1. 建立检验假设 H0：π= 0.80, H1：π<0.80 α=0.05

计算统计量确定P值和作统计推断按ν=∞查附表2（t临界值表），得（单侧）Z0.10=1.2816，知P>0.10。在α=0.05水准上不能拒绝H0。可以认为该医院宣称的有效率尚属客观。

两组独立样本资料的Z检验 H0：π1=π2， H1：π1≠π2 统计量

例6-9 用硝苯吡啶治疗高血压急症患者75例，有效者57例；用硝苯吡啶﹢卡托普利治疗同类患者69例，66例有效。试问两疗法的有效率是否相同？建立检验假设 H0：π1=π2， H1：π1≠π2 α=0.05

计算统计量 p1=57/75=0.76，p2=66/69=0.95652，确定P值和作推断 Z0.001/2=3.2905，所以P<0.001，在α=0.05水准上拒绝H0。可以认为两种疗法有效率不同。

Poisson分布资料的Z检验当总体均数λ≥20时，依据Poisson分布近似正态分布的原理，可以对其总体均数进行推断。

检验假设 H0：λ=λ0， H1：λ≠λ0 检验统计量为

例6-10 某地十年前计划到2000年把孕产妇死亡率降到25/10万以下。2000年监测资料显示，该地区平均而言，每10万例活产儿孕产妇死亡31人。问该地区降低孕产妇死亡的目标是否到达到？建立检验假设 H0：λ=25， H1：λ>25 α=0.05

计算统计量按(6-13)式确定P值和作推断 Z0.10=1.2816，知P>0.10，按α=0.05水准，尚不能拒绝H0。可以认为该地区达到了预定目标。

两组独立样本资料的Z检验当两总体均数都大于20时，依据Poisson分布近似正态分布的原理，可以应用Z检验对其总体均数进行推断。检验假设H0：λ1=λ2， H1：λ1≠λ2

当两样本观测单位数相等时，检验统计量为两样本观测单位数不等时，检验统计量

例6-11 甲、乙两检验师分别观察15名正常人末梢血嗜碱性白细胞数量。每张血片均观察200个视野。结果甲计数到嗜碱性白细胞26个，乙计数到29个。试问两位检验师检查结果是否一致？建立检验假设 H0：λ1=λ2 ， H1：λ1≠λ2 α=0.05

计算统计量按（6-14）式确定P值和作推断按ν=∞查附表2（t临界值表），知Z0.5/2=0.6745，所以P>0.5，按α=0.05水准不能拒绝H0。尚不能认为两检验师检查结果有差异。

例6-12 某车间改革生产工艺前，测得三次粉尘浓度，每升空气中分别有38、29、36颗粉尘；改进工艺后，测取两次，分别为25、18颗粉尘。问工艺改革前后粉尘数有无差别？ 1.建立检验假设 H0：λ1=λ2 ， H1：λ1≠λ2 α=0.05

计算统计量因工艺改革前后观测单位数不等，故分别计算其均数。， n1=3 ， n2=2 Z=2.723>1.96，P<0.05，在α=0.05的水平上拒绝H0。可以认为工艺改革前后粉尘浓度不同，改革工艺后粉尘浓度较低。

假设检验与区间估计的关系置信区间具有假设检验的主要功能显然，H0：不在此区间之内。这与按照α=0.05水准拒绝H0的推断结论是等价的。

单侧检验结合例6-1的资料，对东北某县农村儿童前囟门闭合月龄总体均数μ的95%单侧置信区间的下限为可以看到，H0：被包含在区间（12.869，∞）之内，所以不能拒绝H0。这与假设检验的结论也等价的。

置信区间可提供假设检验没有提供的信息置信区间在回答差别有无统计学意义的同时，还可以提示差别是否具有实际意义在图6-2中，置信区间(1)～(3)均不包含原假设H0，意味着相应的差异具有统计学意义。(1)还提示差异具有实际意义；(2)提示可能具有实际意义；(3)提示实际意义不大。图中的(4)与(5)均无统计学意义，但(4)提示样本量不足。(5)属于可以接受原假设的情况。

假设检验提供，而置信区间不提供的信息

假设检验的功效假设检验的两类错误第Ⅰ类错误:拒绝原本正确的H0，导致推断结论错误。

实际情况检验结果 H0真第Ⅰ类错误 (α) 结论正确(1-α) H0 不真结论正确 (1-β) 第Ⅱ类错误（β）表6-3 推断结论和两类错误实际情况检验结果拒绝H0 不拒绝H0 H0真第Ⅰ类错误 (α) 结论正确(1-α) H0 不真结论正确 (1-β) 第Ⅱ类错误（β）

假设检验的功效 1-β称为假设检验的功效（power of a test）。其意义是，当所研究的总体与H0确有差别时，按检验水平α能够发现它（拒绝H0）的概率。如果1-β=0.90，则意味着当H0不成立时，理论上在每100次抽样中，在α的检验水准上平均有90次能拒绝H0。一般情况下对同一检验水准α，功效大的检验方法更可取

一组样本资料t检验的功效

例6-14 计算例6-1检验的功效1-β。假定根据现有知识可以取σ=5月，δ=0.5月，。由标准正态分布表查这个数值所对应的上侧尾部面积, 得到β=0.8531，于是, 1-β=0.1469。说明例6-1的检验功效太小，即发现δ=0.5个月的差别的机会只有14.69% 。

两组独立样本资料t检验的功效

例6-15 试计算例6-5中检验的功效。假定根据现有知识可以取δ=1mm, σ=1.5mm, . n1=20, n2=34。由标准正态分布表查这个数值所对应的上侧尾部面积, 得到β=0.3228，于是1-β=0.6772。

二项分布两组独立样本资料Z检验的功效

例6-16 试计算例6-9中检验的功效。假定根据现有知识可以取δ=0.15，π1=0.76，π2=0.96， =1.547 由标准正态分布表查这个数值所对应的上侧尾部面积, 得到β=0.0594，于是1-β=0.9406。

应用假设检验需要注意的问题 ★在抽样研究中，研究设计、搜集数据和统计分析是一个整体。每一种假设检验方法都是与相应的研究设计相联系的 ★应用检验方法必需符合其适用条件 ★当样本量一定时，第Ⅰ类错误的概率α变小，第Ⅱ类错误的概率β就变大。 ★正确理解P值的意义。