第13章 有序分类变量的统计推断——非参数检验

Slides:



Advertisements
Similar presentations
第五章 假设检验 Hypothesis Testing 数理统计课题组. 本章大纲 1. 假设检验的基本概念 2.Neyman-Pearson 范式 3. 和假设检验有关的两个问题 4. 广义似然比检验 5. 单样本检验的几个实例 6. 两个样本的比较 7. 实验设计.
Advertisements

2.8 函数的微分 1 微分的定义 2 微分的几何意义 3 微分公式与微分运算法则 4 微分在近似计算中的应用.
考试 1. 时间 :2011 年 11 月 14 日 18:30 2. 地点 : 待定 3. 方式 : 开卷考试 4. 题目类型:待定 5. 计算机操作要求:会用 spss 录数据、计算机 操作、认读结果、制作统计表、按假设检 验步骤进行假设检验.
练一练: 在数轴上画出表示下列各数的点, 并指出这些点相互间的关系: -6 , 6 , -3 , 3 , -1.5, 1.5.
主编 周仁郁. 4.1 非参数检验 配对秩和检验( Wilcoxon 法) 不依赖总体分布类型, 也不对总体参数进行统计推 断的假设检验, 称为非参数检验 配对资料比较时,H 0 为差值总体中位数 M d = 0 H 0 成立时, 配对数据的差值服从以 0 为中心的对称 分布. 把差值按绝对值从小到大用.
7.1 假设检验 1. 假设检验的基本原理 2. 假设检验的相关概念 3. 假设检验的一般步骤 4. 典型例题 5. 小结.
第十二章 非参数检验 (Nonparametric test)
第八章 秩转换的非参数检验 (Nonparametric Test)
壹、資料分析程序 一、資料整理 (一)初步檢查 1.答案的完全性 2.字跡 3.抽樣與訪問的正確性 4.答案的一致性 5.答案的明確性
第五讲 非参数统计分析 吴成秋 南华大学公共卫生学院
统 计 学 (第三版) 2008 作者 贾俊平 统计学.
第四章 两样本位置和尺度检验.
第五章 二次型. 第五章 二次型 知识点1---二次型及其矩阵表示 二次型的基本概念 1. 线性变换与合同矩阵 2.
设计调查 Design Investigation 张煜
第七章 非参数统计 非参数统计(亦称非参数检验),是根据样本资料对总体的某种性质或关系进行假设检验的统计推断方法。 主要特点
6.6 单侧置信限 1、问题的引入 2、基本概念 3、典型例题 4、小结.
完全随机设计多样本资料秩和检验.
第 8 章 假设检验 作者:中国人民大学统计学院 贾俊平 PowerPoint 统计学.
第十一章 非参数检验 (nonparametric test).
第四章 多样本分类数据模型 在参数检验中,我们常常对三个或三个以上的总体的均值进行相等性检验,使用的方法是方差分析,在非参数分析中也会遇到同样的问题,检验多个总体的分布是否相同。更严密的说,当几个总体的分布相同的条件下,讨论其位置参数是否相等。方差分析过程需要假定条件,F检验才有效。可有时候所采集的数据常常不能满足这些条件,像多样本比较时一样,我们不妨尝试将数据转化为秩统计量,因为秩统计量的分布与总体分布无关,可以摆脱总体分布的束缚。秩方法在方差分析中的应用。
§5.3 定积分的换元法 和分部积分法 一、 定积分的换元法 二、 定积分的分部积分法 三、 小结、作业.
第5章 定积分及其应用 基本要求 5.1 定积分的概念与性质 5.2 微积分基本公式 5.3 定积分的换元积分法与分部积分法
第三篇 医学统计学方法. 第三篇 医学统计学方法 医学统计学方法 实习2 主讲人 陶育纯 医学统计学方法 实习2 主讲人 陶育纯 流行病与卫生统计学教研室
本讲义可在网址 或 ftp://math.shekou.com 下载
不确定度的传递与合成 间接测量结果不确定度的评估
第11章 秩转换的非参数检验 (nonparametric test).
無母數統計方法 符號檢定法 W-符號等級檢定法 W-等級和檢定法 K-W檢定法 連檢定 結論
第6章 统计量及其抽样分布 统计量 关于分布的几个概念 由正态分布导出的几个重要分布 样本均值的分布与中心极限定理 样本比例的抽样分布
第三章 多维随机变量及其分布 §2 边缘分布 边缘分布函数 边缘分布律 边缘概率密度.
常用的统计检验 作者 Dr. Maria Correa-Prisant 翻译 lvruiqin(DXY)
第十六章 無母數統計.
第十六章 無母數統計 陳順宇 教授 成功大學統計系.
第七章 SPSS的非参数检验.
4 統計分析程序的選擇.
第八章 均值比较与检验 2019/1/11.
统计软件应用 6 主讲人 陶育纯 SPSS统计分析 统计软件应用 6 主讲人 陶育纯 教案.
第十章 方差分析.
第三篇 医学统计学方法. 第三篇 医学统计学方法 医学统计学方法 实习3 主讲人 陶育纯 医学统计学方法 实习3 主讲人 陶育纯 流行病与卫生统计学教研室
2.1.2 空间中直线与直线 之间的位置关系.
第七章 参数估计 7.3 参数的区间估计.
医学统计学方法 实习3 主讲人 陶育纯 医学统计学方法 实习3 主讲人 陶育纯
探討口腔衛生教育方案 對5-6歲幼兒口腔保健知識和行為之影響
第4章 非线性规划 4.5 约束最优化方法 2019/4/6 山东大学 软件学院.
第一章 函数与极限.
习题 一、概率论 1.已知随机事件A,B,C满足 在下列三种情况下,计算 (1)A,B,C相互独立 (2)A,B独立,A,C互不相容
数列.
抽样和抽样分布 基本计算 Sampling & Sampling distribution
模型分类问题 Presented by 刘婷婷 苏琬琳.
概 率 统 计 主讲教师 叶宏 山东大学数学院.
线 性 代 数 厦门大学线性代数教学组 2019年4月24日6时8分 / 45.
概 率 统 计 主讲教师 叶宏 山东大学数学院.
5.2 常用统计分布 一、常见分布 二、概率分布的分位数 三、小结.
非参数检验 电子工业出版社.
第五章 多总体的统计检验.
用计算器开方.
1.2 有理数 第1课时 有理数 伏家营中学 付宝华.
第八章 均值比较与检验 2019/5/10.
第4课时 绝对值.
第一部分:概率 产生随机样本:对分布采样 均匀分布 其他分布 伪随机数 很多统计软件包中都有此工具 如在Matlab中:rand
第15讲 特征值与特征向量的性质 主要内容:特征值与特征向量的性质.
§5.2 抽样分布   确定统计量的分布——抽样分布,是数理统计的基本问题之一.采用求随机向量的函数的分布的方法可得到抽样分布.由于样本容量一般不止2或 3(甚至还可能是随机的),故计算往往很复杂,有时还需要特殊技巧或特殊工具.   由于正态总体是最常见的总体,故本节介绍的几个抽样分布均对正态总体而言.
第二节 函数的极限 一、函数极限的定义 二、函数极限的性质 三、小结 思考题.
第三节 随机区组设计的方差分析 随机区组设计资料的总平方和可以分解为三项: (10.10).
统计工具的使用方法 主讲人 陶育纯 统计工具的使用方法 主讲人 陶育纯
第十五讲 区间估计 本次课讲完区间估计并开始讲授假设检验部分 下次课结束假设检验,并进行全书复习 本次课程后完成作业的后两部分
第八章 假设检验 8.3 两个正态总体参数的假设检验.
基于列存储的RDF数据管理 朱敏
第三章 从概率分布函数的抽样 (Sampling from Probability Distribution Functions)
第十七讲 密码执行(1).
一元一次方程的解法(-).
Presentation transcript:

第13章 有序分类变量的统计推断——非参数检验 第13章 有序分类变量的统计推断——非参数检验

第13章有序分类变量的统计推断——非参数检验 13.1 非参数检验概述 13.2 两个配对样本的非参数检验 13.3 两个独立样本的非参数检验

13.1 非参数检验概述 13.1.1 非参数检验的意义 13.1.2 非参数检验预备知识

13.1.1 非参数检验的意义 非参数检验(nonparametric testing)是指在总体不服从正态分布且分布情况不明时,用来检验数据资料是否来自同一个总体假设的一类检验方法。由于这些方法一般不涉及总体参数故得名。 这类方法的假定前提比参数性假设检验方法少的多,也容易满足,适用于计量信息较弱的资料且计算方法也简单易行,所以在实际中有广泛的应用。

13.1.1 非参数检验的意义 非参数检验在总体分布未知时有很大的优越性。它总是比传统检验安全。 13.1.1 非参数检验的意义 非参数检验在总体分布未知时有很大的优越性。它总是比传统检验安全。 在总体分布形式已知时,非参数检验不如传统方法效率高。这是因为非参数方法利用的信息要少些。往往在传统方法可以拒绝零假设的情况,非参数检验无法拒绝。 但非参数统计在总体未知时效率要比传统方法要高,有时要高很多。是否用非参数统计方法,要根据对总体分布的了解程度来确定。 

13.1.2 非参数检验预备知识 心中有数:拿到一批数据,总是希望得到数据总体的分布情况,这时可以通过绘制直方图,P-P图,Q-Q图的方式来了解总体的大概分布。 秩(Rank)及秩统计量:非参数检验中秩是最常使用的概念。什么是一个数据的秩呢?一般来说,秩就是该数据按照升幂排列之后,每个观测值的位置。

13.1.2 非参数检验预备知识 例如我们有下面数据 这下面一行(记为Ri)就是上面一行数据Xi的秩。 Xi 15 9 18 3 17 8 13.1.2 非参数检验预备知识 例如我们有下面数据 这下面一行(记为Ri)就是上面一行数据Xi的秩。 Xi 15 9 18 3 17 8 5 13 7 19 Ri 1 4 2 6 10

13.1.2 非参数检验预备知识 利用秩的大小进行推断就避免了不知道背景分布的困难。这也是非参数检验的优点。 13.1.2 非参数检验预备知识 利用秩的大小进行推断就避免了不知道背景分布的困难。这也是非参数检验的优点。 多数非参数检验明显地或隐含地利用了秩的性质;但也有一些非参数方法没有涉及秩的性质。

13.2 两个配对样本的非参数检验 13.2.1 方法原理 13.2.2 分析实例 13.2.3 确切概率的计算

13.2.1 方法原理 两配对样本的非参数检验是在总体分布未知的情况下,通过分析两组配对样本数据,推断总体的分布是否存在明显的差异。 13.2.1 方法原理 两配对样本的非参数检验是在总体分布未知的情况下,通过分析两组配对样本数据,推断总体的分布是否存在明显的差异。 SPSS提供的两配对样本非参数检验主要有符号检验(Sign法),Wilcoxom符号秩检验和McNemar检验。

13.2.1 方法原理 McNemar是一种变化显著性检验,以研究对象作为自身对照,观测每个个体在对照前后是否发生变化,以此检验“前后”的变化是否显著。因此,McNemar检验法处理的是二分值问题,比如比较演说前后同一批选民对竞选人支持或者反对的看法是否有显著性转变。 其基本思想是基于列联表进行分析的,分析的是一个二值变量,采用二项分布检验的办法,检验是否服从0.5为p值的二项分布。

13.2.1 方法原理 符号(Sign)检验,用第一组变量减去第二组变量,记录差的正负符号个数,如果差值为正的个数S+与差值为负的个数S-差别不大,则认为两组样本没有显著差异。 选用统计量S=min(S+,S-),当样本数较小时,S的分布可用二项分布来刻画,当n较大时,S近似服从正态分布。

13.2.1 方法原理 Wilcoxon符号秩检验的基本思想与符号检验类似。 13.2.1 方法原理 Wilcoxon符号秩检验的基本思想与符号检验类似。 用第一组变量减去第二组变量,记录差的正负号并同时保留差的大小,按差的绝对值升序排序,求出变量的秩。然后分别计算正号秩总和W+和负号秩总和W-,如果正负符号秩大致相当,说明分布没有显著差异,否则认为有显著差异。

13.2.1 方法原理 构造统计量W=min(W+,W-),如果两个总体无显著差异,则统计量W近似为n(n+1)/4,或者说W值不会太小,反之如果W值太小,说明两个总体有显著性差异。 当样本数n较大时,Z近似服从正态分布。

13.2.2 分析实例 例13.1 一家日用化工企业拟采用两种去污配方生产新型去污剂,于是挑选了一系列沾染污渍物件进行测试,其中一项是对清除不同污渍所需时间的测试,技术人员想知道它们在这方面的功效是否有差别。 数据见npara1.sav

13.2.2 分析实例 AnalyzeNonparametric Tests 2 Related Samples 13.2.2 分析实例 AnalyzeNonparametric Tests 2 Related Samples Test Pair(S) List:x-y Test Type:wilcoxon 被测物 配方x所需时间 配方y所需时间 A 24 23.1 B 16.7 20.4 C 21.6 17.7 D 23.7 20.7 E 37.5 42.1 F 31.4 36.1 G 14.9 21.8 H 37.3 40.3 I 17.9 26 J 15.5 K 29 35.4 L 19.9 25.5

13.2.2 分析实例 对应与两种配方除污所需要时间的秩的不同关系的秩频数、均值秩及秩和,并标注出一个结。

13.2.2 分析实例 近似概率p=0.029<0.05,拒绝原假设,认为两种配方在除去污渍所需时间的测试中体现出不同的效能,有显著性差别。结合实际数据知x配方比y配方更快。

13.3 两个独立样本的非参数检验 13.3.1 Mann-Whitney U检验 13.3.2 分析实例 13.3 两个独立样本的非参数检验 13.3.1 Mann-Whitney U检验 13.3.2 分析实例 13.3.3 其他两样本非参数检验方法

13.3 两个独立样本的非参数检验 比较两个事物是否相同是实际中经常要研究的问题。如果已知两个事物均是服从正态分布,那么可通过参数检验方法,比较它们的均值和方差是否相同即可。如果两个事物(即总体)的分布不明确,那么参数检验方法就不能用。 两独立样本的非参数检验正是在总体分布未知的情况下,通过两组样本的分析,来推断总体的分布是否存在显著差异的检验方法。例如:两种生产工艺,两种产品差别等。

13.3.1 Mann-Whitney U检验 SPSS中提供了四种方法: Mann-Whitney U法(曼-惠特尼U检验): 通过对平均秩的研究来实现推断的。 Kolmogorov-Smirnov Z法: 类似单样本检验的K-S法,通过对分布的研究来实现推断。

13.3.1 Mann-Whitney U检验 SPSS中提供了四种方法: Moses extreme reactions法(极端反应法): 一个作为控制样本,另一个作为实验样本,将两组样本按从小到大排列,找出控制样本的两个极端位置之差W,如果W偏小,则拒绝原假设。 Wald Wolfwitz Runs法(游程检验法,即Runs法): 通过对游程的研究来实现推断。

13.3.1 Mann-Whitney U检验 下面介绍应用最广的一种方法: 在两个独立总体X和Y中分别抽取m和n个样本,N=m+n,检验假设: H0:两总体分布的中心位置相同 将样本混合后排序,得到每个数值的秩,分别计算样本X和Y的秩和。

13.3.1 Mann-Whitney U检验 记X和Y的秩和分别为WX和WY,满足WX+WY=N(N+1)/2。 当X的样本全部排在Y的样本前面时, WX达到最小m(m+1)/2,定义统计量 U= WX -m(m+1)/2 当原假设成立时,两个样本交错出现,分布均匀,U不会太小或者太大。反之, 如果U偏小或者偏大,则原假设不成立。

13.3.1 Mann-Whitney U检验 当m,n均大于10时,U近似服从正态分布,而Z近似服从标准正态分布。 由样本计算出U的值,并计算相应的显著性概率Sig.,如果Sig.小于给定的显著性水平,则拒绝原假设,认为两个总体有显著性差异。

13.3.2  分析实例 例13.2 一家权威的房屋建筑协会提供了最流行的家居装修工程的成本数据,能否得出厨房的装修成本与主卧室的装修成本存在差异呢? 数据见npara2.sav

13.3.2 分析实例 AnalyzeNonparametric Tests  2 independent Samples 13.3.2  分析实例 AnalyzeNonparametric Tests  2 independent Samples Test Variable: Cost(成本) Grouping: type(1主卧室,2厨房) Test type:四种均选

13.3.2 分析实例 AnalyzeNonparametric Tests  2 independent Samples 13.3.2  分析实例 AnalyzeNonparametric Tests  2 independent Samples Test Variable: Cost(成本) Grouping: type(1主卧室,2厨房) Test type:四种均选 下面主要给出Mann-Whitney test结果,其余方法所得结果类似。

13.3.2  分析实例 此表给出了平均秩次、秩和等情况,可以看出厨房和卧室的装修成本的秩和相差不大。

13.3.2  分析实例 此表给出了Mann-Whitney U统计量值、Wilcoxon W统计量值和Z值(即常用的u值),近似和精确概率都大于给定水平0.05,所以不能拒绝原假设,说明厨房和主卧室的装修成本没有显著性差别。