假设检验.

Slides:



Advertisements
Similar presentations
2.8 函数的微分 1 微分的定义 2 微分的几何意义 3 微分公式与微分运算法则 4 微分在近似计算中的应用.
Advertisements

2.5 函数的微分 一、问题的提出 二、微分的定义 三、可微的条件 四、微分的几何意义 五、微分的求法 六、小结.
全微分 教学目的:全微分的有关概念和意义 教学重点:全微分的计算和应用 教学难点:全微分应用于近似计算.
第八章 X2 检验 卫生(医学)统计学 普通高等教育 “ 十一五 ” 国家级规划教材. X 2 检验用途 1 、推断两个或两个以上的总体率或总体构 成比 之间有无差别; 2 、推断两种属性或两个变量之间有无关联 性; 3 、频数分布的拟合优度检验。
7.1 假设检验 1. 假设检验的基本原理 2. 假设检验的相关概念 3. 假设检验的一般步骤 4. 典型例题 5. 小结.
第十七章 分类资料的统计推断.
第四章 假设检验 第4.1节 假设检验的基本概念 第4.2节 正态总体均值与方差 的假设检验 第4.3节 非参数假设检验方法
二项分布.
第七章 非参数统计 非参数统计(亦称非参数检验),是根据样本资料对总体的某种性质或关系进行假设检验的统计推断方法。 主要特点
第六章 假设检验基础.
6.6 单侧置信限 1、问题的引入 2、基本概念 3、典型例题 4、小结.
完全随机设计多样本资料秩和检验.
第 8 章 假设检验 作者:中国人民大学统计学院 贾俊平 PowerPoint 统计学.
计数资料的统计推断 (2 学时) 吴成秋 公共卫生学院预防医学系
四种命题 2 垂直.
常用逻辑用语复习课 李娟.
§6.3 假设检验的基本概念 我们将讨论不同于参数估计的另一类重要的统计推断问题. 这就是根据样本的信息检验关于总体的某个假设是否正确.
第 八 章 t 检 验.
第八章 假设检验 本章重点: 1、正确建立零假设和备择假设 2、理解第一类错误和第二类错误 3、大样本情况下单个总体的假设检验
第三篇 医学统计学方法. 第三篇 医学统计学方法 医学统计学方法 实习2 主讲人 陶育纯 医学统计学方法 实习2 主讲人 陶育纯 流行病与卫生统计学教研室
本讲义可在网址 或 ftp://math.shekou.com 下载
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
余角、补角.
线性相关分析.
第四章 抽样误差与假设检验 要求: 掌握:均数的抽样误差与标准误,t分 布的特征,t界值表,总体均数可信区间及其与参考值范围的区别。
第三篇 医学统计学方法. 第三篇 医学统计学方法 医学统计学方法 3 主讲人 陶育纯 医学统计分析 医学统计学方法.
成组设计两样本均数的比较 赵耐青 卫生统计教研室.
区间估计 Interval Estimation.
信息技术与数学教学 华东师范大学数学系 万福永 第九讲 几种假设检验的Excel实现.
统计学期末复习
第11章 秩转换的非参数检验 (nonparametric test).
3.解:连续掷同一枚硬币4次的基本事件总数为 ,
t 检验——问题提出 假设检验是通过两组或多组的样本统计量的差别或样本统计量与总体参数的差异来推断他们相应的总体参数是否相同;
第6章 统计量及其抽样分布 统计量 关于分布的几个概念 由正态分布导出的几个重要分布 样本均值的分布与中心极限定理 样本比例的抽样分布
第三章 多维随机变量及其分布 §2 边缘分布 边缘分布函数 边缘分布律 边缘概率密度.
第十章 方差分析.
数据统计与分析 秦 猛 南京大学物理系 手机: 第十讲 数据统计与分析 秦 猛 南京大学物理系 办公室:唐仲英楼A 手机:
常用概率分布 ---Poisson分布.
第七章 参数估计 7.3 参数的区间估计.
习题 一、概率论 1.已知随机事件A,B,C满足 在下列三种情况下,计算 (1)A,B,C相互独立 (2)A,B独立,A,C互不相容
抽样和抽样分布 基本计算 Sampling & Sampling distribution
3.8.1 代数法计算终点误差 终点误差公式和终点误差图及其应用 3.8 酸碱滴定的终点误差
概 率 统 计 主讲教师 叶宏 山东大学数学院.
概 率 统 计 主讲教师 叶宏 山东大学数学院.
5.2 常用统计分布 一、常见分布 二、概率分布的分位数 三、小结.
⑴当∠MBN绕点B旋转到AE=CF时(如图1),比较AE+CF与EF的大小关系,并证明你的结论。
完全随机设计多组资料的比较 赵耐青 卫生统计教研室.
复习.
6.4 你有信心吗?.
§6.7 子空间的直和 一、直和的定义 二、直和的判定 三、多个子空间的直和.
相关与回归 非确定关系 在宏观上存在关系,但并未精确到可以用函数关系来表达。青少年身高与年龄,体重与体表面积 非确定关系:
第4课时 绝对值.
楊志強 博士 國立台北教育大學系 教育統計學 楊志強 博士 國立台北教育大學系
第四节 多个样本均数的两两比较 多个样本均数的两两比较又称多重比较(multiple comparison),其目的是推断究竟哪些总体均数之间存在差别。
第15讲 特征值与特征向量的性质 主要内容:特征值与特征向量的性质.
§5.2 抽样分布   确定统计量的分布——抽样分布,是数理统计的基本问题之一.采用求随机向量的函数的分布的方法可得到抽样分布.由于样本容量一般不止2或 3(甚至还可能是随机的),故计算往往很复杂,有时还需要特殊技巧或特殊工具.   由于正态总体是最常见的总体,故本节介绍的几个抽样分布均对正态总体而言.
第二节 函数的极限 一、函数极限的定义 二、函数极限的性质 三、小结 思考题.
第八章 假设检验 8.1 假设检验的基本概念.
§2 方阵的特征值与特征向量.
第三节 随机区组设计的方差分析 随机区组设计资料的总平方和可以分解为三项: (10.10).
Statistical Methods in Medicine
数理统计基本知识.
第十五讲 区间估计 本次课讲完区间估计并开始讲授假设检验部分 下次课结束假设检验,并进行全书复习 本次课程后完成作业的后两部分
第八章 假设检验 8.3 两个正态总体参数的假设检验.
Sampling Error and Hypothesis Test
单样本检验.
二、配对样本t检验 配对设计(paired design)定义:将受试对象按某些重要特征相近的原则配成对子,每对中的两个个体随机地给予两种处理,称为随机配对设计。
一元一次方程的解法(-).
Presentation transcript:

假设检验

点值估计 参数估计 区间估计 统计推断 假设检验:均数间的比较 比例、率的比较 ……

一、假设检验(hypothesis testing) 样本均数与总体均数不等或两样本均数不等,有两种可能: ①由抽样误差所致 ②两者来自不同的总体 假设检验是用来判断样本与样本,样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。

样本 随机抽样 ? ? 总 体μ 总 体μ0 抽样误差

随机抽样 样本1 统计推断 =? 总 体 样本2 抽样误差

假设检验基本思想: 小概率反证法思想。 小概率思想是指小概率事件(P<0.01或P<0.05)在一次试验中基本上不会发生。反证法思想是先提出假设(检验假设H0),再用适当的统计方法确定假设成立的可能性大小,如可能性小,则认为假设不成立,若可能性大,则还不能认为假设不成立。

例如:抛硬币,通常假设:正反面出现的机会均等,但是如果抛20次只有1次是正面的,你就有理由怀疑原来假设“正反面出现的机会均等”是错的(因为出现这种情况的概率太小了)。同样u检验、t检验也是类似情况:

二、假设检验的基本步骤 第一步:提出检验假设(又称无效假设null hypothesis, H0)和备择假设(alternative hypothesis, H1)。 H0:假设两总体均数相等,即样本与总体或样本与样本间的差异是由抽样误差引起的。 H1:假设两总体均数不相等,即两样本与总体或样本与样本间存在本质差异。 预先设定的检验水准(size of test )α为0.05。 选择单双侧检验 

第二步:选定统计方法,计算出统计量的大小。 根据资料的类型和特点,可分别选用t检验,则计算t值,u检验则计算u值, 或其他检验方法:秩和检验和卡 方检验等。

第三步:根据统计量的大小及其分布确定检验假设成立的可能性P的大小并判断结果。 p值指:在由H0所规定的总体中做随机抽样时,获得等于及大于(或等于及小于)现有统计量的概率。

若P值小于预先设定的检验水准α ,则H0成立的可能性小,即拒绝H0,

u检验和t检验 u检验的应用条件: t检验的应用条件: σ已知或σ未知但n足够大 σ未知n较小 样本来自正态总体 两样本均数比较时还要求两个总体方差相等

一、样本均数与总体均数比较 样本均数与总体均数比较的t检验实际上是推断该样本来自的总体均数µ与已知的某一总体均数µ0(常为理论值或标准值) 有无差别。 在进行样本均数与总体均数比较中,需要建立一个统计量,根据样本所属不同总体,该统计量的分布也不同,由此作出相应的统计推断。

检验统计量的分布特征 举例说明:检验统计量的分布与样本对应的总体的均数有关。 例:设已知总体均数0=70, =2, 样本资料      ,在某总体()中随机抽一个样本量n=40,计算样本均数 其中总体均数有二种可能 H0: = 70次/分 H1: = 75次/分

检验统计量的分布特征(续) 分别求检验统计量U>1.64的概率。 其中 对于H0:=70,则U~N(0,1) , P(U>1.64)=0.05,可以认为是一个小概率事件,对于一次随机抽样一般不会发生的。

检验统计量的分布特征(续) H0和H1的不同分布图以及U>1.64的概率

检验统计量的分布特征(续) 对于H1:=75,则 即:

检验统计量的分布特征(续) 对于=75而言, 概率 由此可以看出:同样是求概率P(U>1.64) 对于H0:=70而言是一个小概率事件 对于H1:=75而言,其发生的概率1 说明:检验统计量U>1.64的概率与样本所在总体有关(与H0是真还是H1是真有关)

样本均数与总体均数比较 例8.3:根据大量调查,已知健康成年男性的脉搏均数为72次/分,标准差为6.0次/分,某医生在一山区随即抽查了25名健康男性,求得其脉搏均数为74.2次/分,问是否能据此认为该山区成年男性的脉搏均数高于一般成年男性?

步骤: 上述两个均数不等既可能是抽样误差所致,也有可能真是环境差异的影响,做假设检验 因为σ已知,可用u检验的单侧检验,检验过程如下:  1. 建立假设  H0:µ=µ0=72次/分,H1:µ>µ0, 检验水准α为单侧0.05。  

2. 计算统计量 进行样本均数与总体均数比较的u检验,计算u值 

3.确定临界值,判断是否应该拒绝。 当H0:µ=µ0=72次/分为真时,在大多数情况下, 应该在72附近,因此      应该在0附近随机摆动。 当H1:µ>µ0=72为真,在大多数情况下,应该远离72,    应该比较大。       

可以证明:当H0为真时,检验统计量服从N(0,1),查标准正态分布表,临界值U0. 05=1. 64,检验统计量u=1. 833>1

定义P值和应用 P值=P(检验统计量>检验统计量样本值|H0) 即:在H0为真的情况下,检验统计量大于样本计算的统计量数值的概率。也就是P值=样本统计量数值开始的尾部面积(示意见图)。 意义:如果检验统计量样本值u=U0.05,则P= U0.05尾部的面积,故P=0.05。

定义P值和应用 如果检验统计量样本值u>U0.05(u值比U0.05 更右侧),则P=u尾部的面积< U0.05尾部的面积,则P<0.05 如果检验统计量样本值u<U0.05 (u值比U0.05 更左侧) ,则P=u尾部的面积>U0.05尾部的面积,则P>0.05 综合上述,P> 检验统计量值<临界值,不拒绝H0 。 P< 检验统计量值>临界值,拒绝H0。

  P值示意图 在实际研究中,只需计算P值并判断是否P<  决定是否拒绝H0。

3. 确定概率P,作出判断 以自由度v(n-1)查u界值表,0.025<P<0.05 拒绝H0,接受H1,可认为该山区成年男性的脉搏均数高于一般成年男性。   

t检验 例8.4若总体标准差σ未知,s=6.5,其他同上例 分析: σ未知,则可用t检验

H0:µ=µ0=72次/分,H1:µ>µ0, 检验水准α为单侧0.05。

按α的检验水准不拒绝H0,即不能认为该山区的成年男子的脉搏高于一般 自由度v=25-1=24 t0.05(24)=1.711 t< t0.05(24),p>0.05, 按α的检验水准不拒绝H0,即不能认为该山区的成年男子的脉搏高于一般

两类错误:

检验效能: H1是真的,实际拒绝H0的概率=1-称为Power又称为检验效能

进行假设检验应注意的问题 (1)做假设检验之前,应注意资料本身是否有可比性。  (2)当差别有统计学意义时应注意这样的差别在实际应用中有无意义。  (3)根据资料类型和特点选用正确的假设检验方法。  (4)根据专业及经验确定是选用单侧检验还是双侧检验。

(5)当检验结果为拒绝无效假设时,应注意有发生I类错误的可能性,即错误地拒绝了本身成立的H0,发生这种错误的可能性预先是知道的,即检验水准那么大;当检验结果为不拒绝无效假设时,应注意有发生II类错误的可能性,即仍有可能错误地接受了本身就不成立的H0,发生这种错误的可能性预先是不知道的,但与样本含量和I类错误的大小有关系。

(6)判断结论时不能绝对化,应注意无论接受或拒绝检验假设,都有判断错误的可能性。  (7)报告结论时是应注意说明所用的统计量,检验的单双侧及P值的确切范围。

t检验和u检验就是统计量为t,u的假设检验,两者均是常见的假设检验方法。 当样本含量n较大时,样本均数符合正态分布,故可用u检验进行分析。 当样本含量n小时,若观察值x符合正态分布,则用t检验(因此时样本均数符合t分布) 当x为未知分布时应采用秩和检验。

可信区间与假设检验的关系 不同:可信区间——量的问题 假设检验——质的问题 1.可信区间亦可用于回答假设检验的问题 2.可信区间比假设检验提供更多的信息 可以回答有无统计学意义,还可回答有无实际意义

STATA命令 正态分布总体均数的95%可信区间 命令为:cii 样本量 样本均数 样本标准差 90%可信区间 例4.2 cii 110 121.72 4.74,level(90) Leve括号中的数字表示可信度