第五章 假设检验 Hypothesis Testing 数理统计课题组. 本章大纲 1. 假设检验的基本概念 2.Neyman-Pearson 范式 3. 和假设检验有关的两个问题 4. 广义似然比检验 5. 单样本检验的几个实例 6. 两个样本的比较 7. 实验设计.

Slides:



Advertisements
Similar presentations
第五节 函数的微分 一、微分的定义 二、微分的几何意义 三、基本初等函数的微分公式与微分运算 法则 四、微分形式不变性 五、微分在近似计算中的应用 六、小结.
Advertisements

2.5 函数的微分 一、问题的提出 二、微分的定义 三、可微的条件 四、微分的几何意义 五、微分的求法 六、小结.
全微分 教学目的:全微分的有关概念和意义 教学重点:全微分的计算和应用 教学难点:全微分应用于近似计算.
第三节 微分 3.1 、微分的概念 3.2 、微分的计算 3.3 、微分的应用. 一、问题的提出 实例 : 正方形金属薄片受热后面积的改变量.
7.1 假设检验 1. 假设检验的基本原理 2. 假设检验的相关概念 3. 假设检验的一般步骤 4. 典型例题 5. 小结.
统 计 学 (第三版) 2008 作者 贾俊平 统计学.
6.6 单侧置信限 1、问题的引入 2、基本概念 3、典型例题 4、小结.
完全随机设计多样本资料秩和检验.
第 8 章 假设检验 作者:中国人民大学统计学院 贾俊平 PowerPoint 统计学.
第六章 假设检验的基本概念.
一、原函数与不定积分 二、不定积分的几何意义 三、基本积分公式及积分法则 四、牛顿—莱布尼兹公式 五、小结
第5章 定积分及其应用 基本要求 5.1 定积分的概念与性质 5.2 微积分基本公式 5.3 定积分的换元积分法与分部积分法
第三篇 医学统计学方法. 第三篇 医学统计学方法 医学统计学方法 实习2 主讲人 陶育纯 医学统计学方法 实习2 主讲人 陶育纯 流行病与卫生统计学教研室
不确定度的传递与合成 间接测量结果不确定度的评估
第三节 格林公式及其应用(2) 一、曲线积分与路径无关的定义 二、曲线积分与路径无关的条件 三、二元函数的全微分的求积 四、小结.
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
2-7、函数的微分 教学要求 教学要点.
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
第一章 商品 第一节 价值创造 第二节 价值量 第三节 价值函数及其性质 第四节 商品经济的基本矛盾与利己利他经济人假设.
平均数检定 庄文忠 副教授 世新大学行政管理学系 SPSS之应用(庄文忠副教授) 2012/7/6.
成组设计两样本均数的比较 赵耐青 卫生统计教研室.
初中数学八年级下册 (苏科版) 10.4 探索三角形 相似的条件(2).
第三章 多维随机变量及其分布 §2 边缘分布 边缘分布函数 边缘分布律 边缘概率密度.
平均数检定 庄文忠 副教授 世新大学行政管理学系 计量分析一(庄文忠副教授) 2011/7/12.
第13章 有序分类变量的统计推断——非参数检验
例1 :甲击中的环数; X :乙击中的环数; Y 平较高? 试问哪一个人的射击水 : 的射击水平由下表给出 甲、乙两人射击,他们
一元线性回归模型 § 1 回归分析概述 § 2 一元线性回归模型的参数估计 § 3 一元线性回归模型的统计检验
第2章 一元线性回归 2 .1 一元线性回归模型 2 .2 参数 的估计 2 .3 最小二乘估计的性质 2 .4 回归方程的显著性检验
第一章.
计算机数学基础 主讲老师: 邓辉文.
第十章 方差分析.
Chap 9 Testing Hypotheses and Assessing Goodness of Fit
连续型随机变量及其概率密度 一、概率密度的概念与性质 二、常见连续型随机变量的分布 三、小结.
課程七 假設檢定.
第七章 参数估计 7.3 参数的区间估计.
第4章 非线性规划 4.5 约束最优化方法 2019/4/6 山东大学 软件学院.
第一章 函数与极限.
人教版五年级数学上册第四单元 解方程(一) 马郎小学 陈伟.
习题 一、概率论 1.已知随机事件A,B,C满足 在下列三种情况下,计算 (1)A,B,C相互独立 (2)A,B独立,A,C互不相容
抽样和抽样分布 基本计算 Sampling & Sampling distribution
相關統計觀念復習 Review II.
模型分类问题 Presented by 刘婷婷 苏琬琳.
概 率 统 计 主讲教师 叶宏 山东大学数学院.
概 率 统 计 主讲教师 叶宏 山东大学数学院.
5.2 常用统计分布 一、常见分布 二、概率分布的分位数 三、小结.
WPT MRC. WPT MRC 由题目引出的几个问题 1.做MRC-WPT的多了,与其他文章的区别是什么? 2.Charging Control的手段是什么? 3.Power Reigon是什么东西?
完全随机设计多组资料的比较 赵耐青 卫生统计教研室.
第五章 多总体的统计检验.
用计算器开方.
定理21.9(可满足性定理)设A是P(Y)的协调子集,则存在P(Y)的解释域U和项解释,使得赋值函数v(A){1}。
§6.7 子空间的直和 一、直和的定义 二、直和的判定 三、多个子空间的直和.
1.设A和B是集合,证明:A=B当且仅当A∩B=A∪B
第4课时 绝对值.
第一部分:概率 产生随机样本:对分布采样 均匀分布 其他分布 伪随机数 很多统计软件包中都有此工具 如在Matlab中:rand
静定结构位移计算 ——应用 主讲教师:戴萍.
第15讲 特征值与特征向量的性质 主要内容:特征值与特征向量的性质.
§5.2 抽样分布   确定统计量的分布——抽样分布,是数理统计的基本问题之一.采用求随机向量的函数的分布的方法可得到抽样分布.由于样本容量一般不止2或 3(甚至还可能是随机的),故计算往往很复杂,有时还需要特殊技巧或特殊工具.   由于正态总体是最常见的总体,故本节介绍的几个抽样分布均对正态总体而言.
概率论与数理统计B.
第二节 函数的极限 一、函数极限的定义 二、函数极限的性质 三、小结 思考题.
第八章 假设检验 8.1 假设检验的基本概念.
第三节 随机区组设计的方差分析 随机区组设计资料的总平方和可以分解为三项: (10.10).
第十五讲 区间估计 本次课讲完区间估计并开始讲授假设检验部分 下次课结束假设检验,并进行全书复习 本次课程后完成作业的后两部分
第十四章 假设检验 (Hypothesis Testing)
第八章 假设检验 8.3 两个正态总体参数的假设检验.
第三章 从概率分布函数的抽样 (Sampling from Probability Distribution Functions)
贝叶斯估计 Bayes Estimation
本底对汞原子第一激发能测量的影响 钱振宇
第三节 数量积 向量积 混合积 一、向量的数量积 二、向量的向量积 三、向量的混合积 四、小结 思考题.
第十七讲 密码执行(1).
Presentation transcript:

第五章 假设检验 Hypothesis Testing 数理统计课题组

本章大纲 1. 假设检验的基本概念 2.Neyman-Pearson 范式 3. 和假设检验有关的两个问题 4. 广义似然比检验 5. 单样本检验的几个实例 6. 两个样本的比较 7. 实验设计

学习目标 理解假设检验的直观概念和 Neyman- Pearson 范式 了解假设检验方法的可能缺陷 掌握广义似然比检验 掌握正态、多项、泊松总体的假设检验 掌握 Hanging Rootogram 和概率图 掌握两个独立样本的比较 理解实验设计

本章详细大纲 假设检验的基本概念 Neyman-Pearson 范式 Neyman-Pearson 引理 显著性水平的确定和 p- 值 一致最优检验 和假设检验有关的两个问题 置信区间和假设检验的对偶关系 如何选择原假设 广义似然比检验 – 广义似然比方法 – 多项分布的广义似然比检验 – 泊松分布的广义似然比检验 单样本检验的几个实例 两个样本的比较

(Hypothesis Testing) 1. 假设检验的基本概念 (Hypothesis Testing) 硬币猜测游戏 用似然比 likelihood ratio 和 贝叶斯方法处理这个问题 正面朝上的概率 硬币 硬币 1 0.7

猜硬币中的似然比 如果你在 10 次抛掷中看到 2 次正面朝上。则 P 0 (2)/P 1 (2)=30 。这就是似然比。 硬币 0 出现这个结果的机会是硬币 1 的 30 倍

猜硬币中的似然比 根据抛掷结果计算出的后验概率成为评判 标准 C 是临界值 critical value

猜硬币中的错判概率 假定 c=1 。则判别规则如下: 因为结果有随机性,这个规则导致错判 错误分成两类: H 0 为真的时候拒绝 H 0 , H 0 为假的时候接受 H 0

临界值 c 对错判概率的影响 假定 c=0.1 ,即先验概率有差异

2.Neyman-Pearson 范式 不用贝叶斯方法 规避了先验概率的决定 对两个假设区别对待,一个成为原假设 H 0 (null hypotheses) ,另一个成为备择 假设 H 1 (alternative hypotheses) 由此导致在有些场合下选择原假设的困难

Neyman-Pearson 范式中的术语 第 I 类错误 (Type I Error) , H 0 为真的时候拒绝 H 0 检验的显著性水平 (significance level) ,第 I 类 错误的概率,通常记为 第 II 类错误 (Type I Error) , H 0 为假的时候接受 H 0 ,其概率记为 检验的功效 (power) , H 0 为假的时候拒绝 H 0 , 其概率记为 检验统计量 (test statistics) 拒绝域 (rejection region) 和接受域 (acceptance region) 原分布 (null distribution) ,在原假设为真的条 件检验统计量所服从的分布

Neyman-Pearson 引理 (lemma)

方差已知的正态

方差已知的正态

置信区间和假设检验的对偶关系

置信区间和假设检验的对偶关系:引理 A 引理 A

置信区间和假设检验:引理 A 证明 引理 A 证明 则按照 C(X) 的定义

置信区间和假设检验的对偶关系:引理 B 引理 B 证明

广义似然比检验 ( Generalized Likelihood Ratio Test ) 似然比检验在对两个简单假设进行检验的时候是 最优的。本节介绍的广义似然比检验将能够处理 比较复杂的假设形式。其原理和似然比有相似之 处。 一个比较自然的度量两个假设可信程度的指标是 两个假设的似然比。

广义似然比检验 因为在两个假设中,参数都有多个可能取值,所以 在可能的参数集合上取最大值是一个可以考虑的 出于数学处理上的考虑,把分母改成在 整个参数集合上取最大值

广义似然比检验: 方差未知正态总体的均值检验

多项分布的广义似然比检验 考虑多项分布的似然比检验。

多项分布的广义似然比检验

Pearson 卡方统计量和似然比 可以证明在 H 0 成立的条件下, Pearson 统计量和似然比渐近等价, 这里用 Taylor 展开做一直观解释。

Pearson 卡方统计量和似然比

Handy-Weinberg 均衡 在参数估计的例子中引入了 Handy-Weinberg 均衡

Bacterial Clump 用显微镜检查 0.01 毫升牛奶中的细菌群的数量. 计量方法是每个方格子里的数量 看起来用泊松分布是不错的 以下数据来自 Bliss and Fisher (1953)

Bacterial Clump

Fisher 重新检验孟德尔 (Mendel) 的数据 现代基因理论的结果孟德尔的观测结果 Pearson 卡方统计量= 0.604

泊松散布度检验 (dispersion test) 泊松分布的特点是均值和方差相等

泊松散布度检验 (dispersion test)

近似公式可以有如下解释:等于方差估计值除以 均值估计值的比率的 n 倍 泊松分布的方差和均值相等,但一般情况下的数据 的方差大于均值。因此这个检验称为散布度检验 比如负二项分布和泊松分布相比就具有 更大的散布程度

泊松散布度检验:石棉纤维

泊松散布度检验:细菌菌落

更多的评估拟合优度的方法 Hanging rootograms Probability plots 正态性检验

Hanging rootograms 原理:用图象展示观测值和拟合值的直方 图之间的差异 演示数据:来自 Martin, Gudzinowicz and Fanger 1975 ,共 152 通常会用正态分布来拟合所得到的数据

Hanging rootograms

Probability plots 要对一组数据对某个理论分布的拟合程度进行定性判断, 概率图是极为有用的一种图形工具

Probability plots 均匀-均匀概率图

Probability plots

概率图 显然这条曲线 不是线性的 均匀 - 三角概率图

概率图:概率积分变换 probability integral transformation

概率图:特定的 F(x)

概率图: Michelson 光速测定实验结果

正态性检验

比较两个独立样本 (Independent Samples)

比较两个独立样本:基于正态分布

比较两个独立样本:基于正态分布 方差已知

比较两个独立样本:基于正态分布 方差未知

定理 A 的证明 统计量可以表示为 U/V. U 服从标准正态分布. V 等于卡方随机变量除以其分布自由度. U/V 服从 t 分布

比较两个独立样本:基于正态分布 方差未知

比较两个独立样本:基于正态分布 方差未知,例 A 问题: 今有 A 和 B 两种决定冰的热功当量的方法 此处放箱线图

比较两个独立样本:基于正态分布 方差未知,例 A 自由度为 19 的 t 分布的.975 分位点等于 即 (.015,.065)

两样本假设检验 双侧备择假设 two-sided alternative 单侧备择假设 one-sided alternative

两样本假设检验,续例 A

检验 H 0 对 H 1 等价于似然比检验

求最大值:似然比的分子部分

求最大值:似然比的分母部分

似然比的计算结果

分子部分的变换

如果方差不相等 以它为 t 统计量的分母,所得到的统计量不再服从 t 分布, 但近似服从自由度为下述结果取整之后的结果的 t 分布

教材例 [ 待处理 ]

教材例 下面是对数变换的模型

变异系数 (coefficient of variation) 一个分布的标准差和均值的比率称为变异系数 (coefficient of variation)

对于变换后的数据, t 统计量为.917 , p- 值为.37 。 没有理由拒绝原假设。 95% 置信区间是 (-.61,.23)

功效 (power) 计算功效对于在规划实验时确定样本量的大小具有重要意义。 检验的功效是在原假设为假的时候拒绝原假设的概率。 影响两样本 t 检验的四个要素包括:

功效的计算

例 A 。两样本比较。样本量均为 18 ,来自正态总体, 标准差都是 5 ,显著性水平.05 。

非参数方法: Mann-Whitney 检验 这个检验也叫 Wilcoxon 秩和检验 (Wilcoxon Rank Sum Test) 将 m+n 次实验分配给处理组和对照组, 随机抽取 n 个分配给对照组,剩下的 m 个给处理组 要检验的原假设是处理没有效应。 如果原假设通过检验,就说明结果中的差异是由随机化造成的 统计量的计算方法如下 1 、将 m+n 个观测值放在一起,按照升序排列。 (为简化问题,假定没有并列名次。实际上,出现并列 名次并不影响我们的计算)。 2 、计算来自对照组的观测值的秩的和 3 、如果秩和太大或者太小就可以拒绝原假设

Mann-Whitney 检验的简单例子 4 位受试,随机抽取其中两名进入处理组,剩下两名在对照组 表中的数据是实验结果(响应值),括号中出现的是这个值的秩 对照组的秩和等于 7 ,处理组的秩和等于 3 这个差异足以让我们相信在处理组和对照组的结果之间 存在系统的差别吗?让我们来做一个概率计算。

Mann-Whitney 检验的简单例子 Mann-Whitney 检验的关键思想是: 我们可以用显式公式计算原假设下的秩和分布。 在原假设下,所有观测值的秩的组合 都是等概率的。这样一共有 4!=24 种结果。 特别地,处理组的结果的秩 有 6 种,也应该是等概率出现的。

Mann-Whitney 检验 实际中的检验问题不可能有这么小的 m 和 n

Mann-Whitney 检验:例 A 数据来自教材 423 页,例 A 排序结果,有并列排名 并列排名的处理方式: 比如有 4 个值都等于 。它们 占据的名次为 3,4,5 和 6 ,则每个 数的秩都等于 ( )/4=4.5

Mann-Whitney 检验:例 A

Mann-Whitney 检验:定理 A 证明提示: 利用教材 的定理 A 和 B

Mann-Whitney 检验:定理 A 的证明

Mann-Whitney 检验 1.Mann-Whitney 检验不依赖正态假设 2. 用排序名次取代实际数字,对离群值不敏感 3. 可以证明,如果正态假设成立,则 Mann-Whitney 检 验和 t 分布的功效几乎相等 4. 下面我们用另一种观点看待 Mann-Whitney 检验

Mann-Whitney 检验

贝叶斯方法

解释是完全不一样的

贝叶斯方法 补充例题

比较配对样本 comparing paired samples 许多实验中使用的不是独立样本,而是配对样本。 医学实验。受试可能按照年龄、体重或者患病程度 配对,然后每个对中的一个成员会被随机分到处理组 ,另一个进入对照组。 或者,对是由同一位受试在计量 “ 之前 ” 和 “ 之后 ” 构成 关键问题是如何处理 “ 不独立 ” 样本的相关性

比较配对样本

配对实验的优势在于,如果 X 和 Y 的相关系数大于 0 , 则估计值的方差更小

比较配对样本:正态分布

比较配对样本:正态分布,例 A 数据: Levine(1973) 研究

比较配对样本:正态分布

比较配对样本非参数方法, 符号秩检验 signed rank text