第七章非参数统计非参数统计（亦称非参数检验），是根据样本资料对总体的某种性质或关系进行假设检验的统计推断方法。主要特点

Slides:

Advertisements

Similar presentations

因数与倍数 2 、 5 的倍数的特征

Advertisements

第五节函数的微分一、微分的定义二、微分的几何意义三、基本初等函数的微分公式与微分运算法则四、微分形式不变性五、微分在近似计算中的应用六、小结.

2.5 函数的微分一、问题的提出二、微分的定义三、可微的条件四、微分的几何意义五、微分的求法六、小结.

加強輔導課程家長簡介會時間： 9 月 30 日（二）晚上 : 6:45 至 8 ： 00 地點：禮堂.

练一练：在数轴上画出表示下列各数的点，并指出这些点相互间的关系： -6 ， 6 ， -3 ， 3 ， -1.5, 1.5.

第八章 X2 检验卫生（医学）统计学普通高等教育 “ 十一五 ” 国家级规划教材. Ｘ 2 检验用途 1 、推断两个或两个以上的总体率或总体构成比之间有无差别； 2 、推断两种属性或两个变量之间有无关联性； 3 、频数分布的拟合优度检验。

主编周仁郁. 4.1 非参数检验配对秩和检验（ Wilcoxon 法）不依赖总体分布类型, 也不对总体参数进行统计推断的假设检验, 称为非参数检验配对资料比较时,H 0 为差值总体中位数 M d ＝ 0 H 0 成立时, 配对数据的差值服从以 0 为中心的对称分布. 把差值按绝对值从小到大用.

7.1 假设检验 1. 假设检验的基本原理 2. 假设检验的相关概念 3. 假设检验的一般步骤 4. 典型例题 5. 小结.

第八章互换的运用.

第十二章非参数检验（Nonparametric test）

专题二　文学类文本·小说阅读(选考) ——把握人事，洞察百态补上一课如何读懂小说第1讲情节第2讲人物第3讲环境　

统计学 (第三版) 2008 作者贾俊平统计学.

英德美法标志 1689年《权利法案》 1871年《德意志帝国宪法》 1787年宪法 1875年法兰西第三共和国宪法政体君主立宪制民主共和制行政权内阁、首相皇帝、宰相总统立法权议会国会权力中心皇帝特点君主虚位议会至上军事封建皇帝权重总统共和制议会共和制.

资料连续型资料离散型资料大样本小样本.

一、能线性化的多元非线性回归二、多元多项式回归（线性化）

设计调查 Design Investigation 张煜

第四章概率、正态分布、常用统计分布.

6.6 单侧置信限 1、问题的引入 2、基本概念 3、典型例题 4、小结.

完全随机设计多样本资料秩和检验.

第 8 章假设检验作者：中国人民大学统计学院贾俊平 PowerPoint 统计学.

第八章假设检验本章重点： 1、正确建立零假设和备择假设 2、理解第一类错误和第二类错误 3、大样本情况下单个总体的假设检验

第四节对数留数与辐角原理一、对数留数二、辐角原理三、路西定理四、小结与思考.

第三篇医学统计学方法. 第三篇医学统计学方法医学统计学方法实习2 主讲人陶育纯医学统计学方法实习2 主讲人陶育纯流行病与卫生统计学教研室

主要内容 § 3.1 多维随机变量及联合分布联合分布函里数联合分布律联合概率密度 § 3.2 二维随机变量的边缘分布

本讲义可在网址或 ftp://math.shekou.com 下载

不确定度的传递与合成间接测量结果不确定度的评估

§5 微分及其应用一、微分的概念实例:正方形金属薄片受热后面积的改变量..

§5 微分及其应用一、微分的概念实例:正方形金属薄片受热后面积的改变量..

线性相关分析.

第四章抽样误差与假设检验要求：掌握：均数的抽样误差与标准误，t分布的特征，t界值表，总体均数可信区间及其与参考值范围的区别。

统计学期末复习

第6章统计量及其抽样分布统计量关于分布的几个概念由正态分布导出的几个重要分布样本均值的分布与中心极限定理样本比例的抽样分布

复习引入数据统计学的核心思想是根据样本的情况对总体的相应情况作出估计和推断 2.统计学研究问题的步骤

第三章多维随机变量及其分布 §2 边缘分布边缘分布函数边缘分布律边缘概率密度.

第13章有序分类变量的统计推断——非参数检验

例1 ：甲击中的环数； X ：乙击中的环数； Y 平较高？试问哪一个人的射击水：的射击水平由下表给出甲、乙两人射击，他们

第2章一元线性回归 2 .1 一元线性回归模型 2 .2 参数的估计 2 .3 最小二乘估计的性质 2 .4 回归方程的显著性检验

本次课讲授：第二章第十一节，第十二节，第三章第一节，下次课讲第三章第二节，第三节，第四节；下次上课时交作业P29—P30

第十章方差分析.

第七章参数估计 7.3 参数的区间估计.

习题一、概率论 1.已知随机事件A，B，C满足在下列三种情况下，计算（1）A，B，C相互独立（2）A，B独立，A，C互不相容

抽样和抽样分布基本计算 Sampling & Sampling distribution

模型分类问题 Presented by 刘婷婷苏琬琳.

概率统计主讲教师叶宏山东大学数学院.

线性代数厦门大学线性代数教学组 2019年4月24日6时8分 / 45.

5.2 常用统计分布一、常见分布二、概率分布的分位数三、小结.

非参数检验电子工业出版社.

完全随机设计多组资料的比较赵耐青卫生统计教研室.

第五章多总体的统计检验.

第4章 Excel电子表格制作软件 4.4 函数（一）.

相关与回归非确定关系在宏观上存在关系，但并未精确到可以用函数关系来表达。青少年身高与年龄，体重与体表面积非确定关系：

概率统计主讲教师叶宏山东大学数学院.

第4课时绝对值.

第四节随机变量函数的概率分布 X 是分布已知的随机变量，g ( · ) 是一个已知的连续函数，如何求随机变量 Y =g(X ) 的分布？

第一部分：概率产生随机样本：对分布采样均匀分布其他分布伪随机数很多统计软件包中都有此工具如在Matlab中：rand

第四节多个样本均数的两两比较多个样本均数的两两比较又称多重比较(multiple comparison)，其目的是推断究竟哪些总体均数之间存在差别。

分数再认识三真假带分数的练习课.

§5.2 抽样分布　　确定统计量的分布——抽样分布，是数理统计的基本问题之一．采用求随机向量的函数的分布的方法可得到抽样分布．由于样本容量一般不止2或 3(甚至还可能是随机的)，故计算往往很复杂，有时还需要特殊技巧或特殊工具．　　由于正态总体是最常见的总体，故本节介绍的几个抽样分布均对正态总体而言．

概率论与数理统计B.

第二节函数的极限一、函数极限的定义二、函数极限的性质三、小结思考题.

第三节随机区组设计的方差分析随机区组设计资料的总平方和可以分解为三项：（10.10）.

难点：连续变量函数分布与二维连续变量分布

第十五讲区间估计本次课讲完区间估计并开始讲授假设检验部分下次课结束假设检验，并进行全书复习本次课程后完成作业的后两部分

第十四章假设检验 (Hypothesis Testing)

第八章假设检验 8.3 两个正态总体参数的假设检验.

第三章从概率分布函数的抽样 (Sampling from Probability Distribution Functions)

学习目标 1、什么是列类型 2、列类型之数值类型.

Presentation transcript:

第七章非参数统计非参数统计（亦称非参数检验），是根据样本资料对总体的某种性质或关系进行假设检验的统计推断方法。主要特点第七章非参数统计非参数统计（亦称非参数检验），是根据样本资料对总体的某种性质或关系进行假设检验的统计推断方法。主要特点不要求总体分布已知或对总体分布作任何限制性假定；不以估计总体参数为目的；能适用于定性变量中的定类数据或定序数据 ,也能适用于定距数据和定比数据这种定量变量方法直观，易于理解，运算比较简单。缺点是检验的功效不如参数检验方法。

χ2检验主要内容成对比较检验曼—惠特尼U检验游程检验等级相关检验

χ2检验一、什么是χ2检验 χ2检验是利用随机样本对总体分布与某种特定分布拟合程度的检验，也就是检验观察值与理论值之间的紧密程度。设有k（K＞2）个观察值，f0为它们的实际频数，fe为理论频数。构造一个统计量其中，k-1为自由度。皮尔生定理表明，当样本容量充分大时，样本分成K类，则χ2统计量服从χ2分布。自由度为k-1

利用样本信息对总体分布作出推断，检验总体是否服从某种理论分布（如二项分布、均匀分布或正态分布等）。二、应用 1、拟合优度检验利用样本信息对总体分布作出推断，检验总体是否服从某种理论分布（如二项分布、均匀分布或正态分布等）。检验步骤对总体分布建立假设 H0：总体服从某种理论分布 H1：总体不服从该理论分布抽样并对样本资料编成频数分布，形成k个互斥的类型组。（f0）计算检验统计量以“原假设H0为真”导出一组期望频数（fe）比较χ2值与临界值作出检验判断

自由度（df）＝k-1-m。其中k为组数。（各组理论频数不得小于5，如不足5，可合并相邻的组，如需合并，则k为合并后的组数） m为计算理论频数时所估计参数的个数。（未指定总体的参数，需要观察值计算相应的统计量，作为未参数的估计值）。

用于判断两个变量是否存在交互影响。如果两个变量不存在交互影响，就称为独立，所以这类检验也称为独立性检验。二、应用 2、独立性检验用于判断两个变量是否存在交互影响。如果两个变量不存在交互影响，就称为独立，所以这类检验也称为独立性检验。检验步骤对总体的两个变量建立假设 H0：两变量独立 H1：两变量关联将样本资料编成r×c列联表，并列出实际频数Oij 计算检验统计量计算理论频数比较χ2值与临界值作出检验判断

要点说明列联表形式（r×c） x 列（c） y 合计 1 2 3 … c 1 2 3 . r O11 O21 O31 . Or1 O12 O1c O2c O3c . Orc O1 O2 O3 . Or 行（r） y的边缘频数合计 n.1 n.2 n.3 … n.c n X的边缘频数

理论频数Eij的计算先求理论频率（作为概率的近似）。概率论中关于概率独立的基本规则：如果两事件独立，则它们的联合概率等于它们各自概率的乘积，P（A·B）=P（A）·P（B）。因此，某一行某一列的联合概率：自由度（df）的确定 df=(r-1)(c-1)

r·c=2×2的列联表资料，χ2值简算公式 x 1 2 合计 y a b a+b 1 c+d 2 c d 合计 a+c b+d n

成对比较检验是对两个相关样本的比较分析。有符号检验和威尔科克森带符号的等级检验两种方法。符号检验也称正负号检验，其基本思想是分析正负号出现的频率而忽略具体量的差异，以确定他们是否有显著差异的一种检验方法。

检验步骤 1.确定配对样本，分别计算差异正与负的数目，无差异则记为0，将它从样本中剔除，并相应地减少样本容量n，把正负号数目之和视为样本总个数(n) 。 2.建立假设：H0： p=0.5 ； H1：p≠0.5 3.观察样本容量，如果n≤25，则作为二项分布处理如果n＞25，则作为正态近似处理。 4.设定显著性水平α，并查表确定临界值，进行比较和作出判断。

例 1：随机抽取12个单位，放映一部描述吸烟有害健康的影片，并调查得到观看电影前后各单位职工认为吸烟有害的人数的百分比。检验该电影宣传是否有效果（α=0.05）。解：H0：P=0.5 H1：P > 0.5 P（0）=0.0002， P（1）=0.0030， P（2）=0.0161， P（3）=0.0537 P（0）+P（1）+P(2)=0.0193＜0.05 P（3）+0.0193＝0.0537＋0.0193=0.073>0.05

可见，拒绝域应为0，1，2。 1 2 3 4 5 6 7 8 9 10 11 12 拒绝域现检验统计量（-）=3 （即3个负号），0.073＞0.05所以，原假设H0：P=0.5在5%显著性水平上不能被拒绝。也即不能认为职工在观看影片前后的认识有显著提高。

例2：随机抽取60名消费者对甲、乙两种品牌的饮料评分，甲、乙得分之差为“+”号者35个，“-”号15 个，“0”号10个。以显著性水平α=0.05检验两种饮料是否同等受欢迎。解：H0：P=0.5， H1：P≠0.5 ∵n＞25，∴按正态分布近似处理该成数抽样分布的均值和标准差分别为 2.82＞1.96，所以，拒绝原假设。认为两种饮料并不受到同等欢迎。且乙种优于甲种。

这种检验方法不仅考虑了两组数据差异的正、负号，而且还利用了其差异大小的信息。因此，是一种更为有效的检验方法。威尔科克森带符号的等级检验这种检验方法不仅考虑了两组数据差异的正、负号，而且还利用了其差异大小的信息。因此，是一种更为有效的检验方法。 1、应用条件和检验内容与符号检验相同。 2、方法思想：若关联样本的两组数据没有显著差异，则不仅其差异的正、负符号应大致相等，而且将其差的数值按大小顺序排列编自然序号（即秩）后，它们的正号（+）的秩和（记为T+）与负号（-）的秩和（记为T-）也应该大致相等。其中之较小者也应趋近于总秩和的平均数（）。若正秩和（T+）与负秩和（T-）相差太大，其中较小者偏离总秩和的平均（）较远，以致超过给定显著性水平α所确定的临界点，就可以认为这两组数据存在显著差异，即总体的分布不相同。

检验步骤将样本数据配对并计算各对正负差值将差数取绝对值按从小到大顺序排列并编上等级，即确定顺序号1、2、3等。对于相等的值，则取其位序的平均数为等级建立假设：H0：T+= T- ； H1 ： T+ ≠T-(双侧) H1 ：T+＞T-或T+＜T-(单侧) 计算检验统计量: 当n>25时当n≤25时，取T+、T-中之小者

设定α，并查表确定临界值Tα(或Zα/2) 比较检验值与临界值作出判断，对于n≤25，T≤Tα，拒绝H0； T＞Tα，接受H0 接受区域拒绝区域 Tα=5 =22.5 Tα=40 拒绝区域

曼—惠特尼U检验曼—惠特尼U检验适用于从两个总体中分别独立抽取两个样本的检验，方法思想与威尔科克森秩和检验相同。检验步骤：从总体A、B中分别独立抽取样本nA和nB，将（nA+nB）个观察值从小到大编序分别计算两个样本，的秩和TA和TB 建立假设H0：两总体A和B相对次数分布相同 H1：两总体相对次数分布不同

计算检验统计量 ①nA、nB＜10时，取UA、UB中小者 UA= nAnB+ nA（nA +1）/2-TA UB= nAnB+ nB（nB +1）/2-TB ②nA、nB＞10时设定显著性水平α，查U表或Z表得到临界值比较统计量与临界值，作出判断，对于nA、nB＜20 U≤Uα，拒绝H0， U＞Uα，接受H0

游程检验一、什么是游程检验 (i) r=5, (ii) r=2, (iii) r=11 游程检验（亦称连贯检验）是根据样本标志表现排列所形成的游程的多少进行判断的检验方法。设某样本n=12人的标志表现为男、女，有以下三种排列。 (i) 男，男，女，女，女，男，女，女，男，男，男，男 (ii) 男，男，男，男，男，男，男，女，女，女，女，女 (iii) 男，女，男，女，男，女，男，女，男，女，男，男连续出现男或女的区段称为游程。每个游程包含的个数为游程长度。以r表示序列中游程的个数： (i) r=5, (ii) r=2, (iii) r=11

（i）是随机性序列；（ii）（iii）是非随机性序列，所以，可以用游程的个数来检验样本的随机性，或总体的分布特征。二、游程检验方法 1．检验总体分布是否相同。将从两个总体中独立抽取的两个样本的观察值混合有序后，观察游程个数，进行比较。 2．检验样本的随机性将取自某一总体的样本的观察值按从小到大顺序排列，找出中位数（或平均数），分为大于中位数的小于中位数的两个部分。用上下交错形成的游程个数来检验样本是否是随机的。

3．检验规则（小样本，n1与n2都小于20）应用表La和Lb，（α=0.05，r为临界值）（1）单侧检验：观察到的游程个数 ro≤临界值（La表）否定Ho 或ro≥临界值（Lb表）反之，接受Ho。（2）双侧检验：观察到的游程个数ro r(La)＜ro＜r(Lb) 接受Ho 下限上限反之，拒绝Ho

4．大样本（n1或n2大于20），游程个数r近似正态分布检验统计量其中：

等级相关检验一、等级相关检验的基本原理将两组变量按顺序等级排列，在等级的基础上计算等级相关系数，从而反映两组变量之间联系的密切程度。等级相关系数的计算公式其中di为两变量每一对样本的等级之差，n为样本容量。等级相关系数与相关系数一样，取值-1到+1之间，区别是它是建立在等级的基础上计算的，较适用于反映序列变量的相关。

二、等级相关系数的应用利用斯皮尔曼等级相关系数，可以对两序列变量是否相关进行检验。（一）检验的假设（1）H0：rs=0 , Xi和Yi 相互独立； H1：Xi和Yi不独立。（此为双侧检验）（2）H0： rs=0 ，Xi和Yi相互独立； H1： Xi和Yi是正相关。(即Xi的大值与Yi的大值相配对) （3）H0： rs=0 ，Xi和Yi相互独立； H1：Xi和Yi是负相关。(即Xi的大值与Yi的小值相配对)

（二）检验统计量：