第七章 非参数统计 非参数统计(亦称非参数检验),是根据样本资料对总体的某种性质或关系进行假设检验的统计推断方法。 主要特点

Slides:



Advertisements
Similar presentations
因数与倍数 2 、 5 的倍数的特征
Advertisements


第五节 函数的微分 一、微分的定义 二、微分的几何意义 三、基本初等函数的微分公式与微分运算 法则 四、微分形式不变性 五、微分在近似计算中的应用 六、小结.
2.5 函数的微分 一、问题的提出 二、微分的定义 三、可微的条件 四、微分的几何意义 五、微分的求法 六、小结.
加強輔導課程家長簡介會 時間: 9 月 30 日(二) 晚上 : 6:45 至 8 : 00 地點:禮堂.
练一练: 在数轴上画出表示下列各数的点, 并指出这些点相互间的关系: -6 , 6 , -3 , 3 , -1.5, 1.5.
第八章 X2 检验 卫生(医学)统计学 普通高等教育 “ 十一五 ” 国家级规划教材. X 2 检验用途 1 、推断两个或两个以上的总体率或总体构 成比 之间有无差别; 2 、推断两种属性或两个变量之间有无关联 性; 3 、频数分布的拟合优度检验。
主编 周仁郁. 4.1 非参数检验 配对秩和检验( Wilcoxon 法) 不依赖总体分布类型, 也不对总体参数进行统计推 断的假设检验, 称为非参数检验 配对资料比较时,H 0 为差值总体中位数 M d = 0 H 0 成立时, 配对数据的差值服从以 0 为中心的对称 分布. 把差值按绝对值从小到大用.
7.1 假设检验 1. 假设检验的基本原理 2. 假设检验的相关概念 3. 假设检验的一般步骤 4. 典型例题 5. 小结.
第八章 互换的运用.
第十二章 非参数检验 (Nonparametric test)
专题二 文学类文本·小说阅读(选考) ——把握人事,洞察百态 补上一课 如何读懂小说 第1讲 情节 第2讲 人物 第3讲 环境 
统 计 学 (第三版) 2008 作者 贾俊平 统计学.
英 德 美 法 标志 1689年 《权利法案》 1871年 《德意志帝国宪法》 1787年宪法 1875年法兰西第三共和国宪法 政体 君主立宪制 民主共和制 行政权 内阁、首相 皇帝、宰相 总统 立法权 议会 国会 权力中心 皇帝 特点 君主虚位 议会至上 军事封建 皇帝权重 总统共和制 议会共和制.
资 料 连续型资料 离散型资料 大样本 小样本.
一、能线性化的多元非线性回归 二、多元多项式回归(线性化)
设计调查 Design Investigation 张煜
第四章 概率、正态分布、常用统计分布.
6.6 单侧置信限 1、问题的引入 2、基本概念 3、典型例题 4、小结.
完全随机设计多样本资料秩和检验.
第 8 章 假设检验 作者:中国人民大学统计学院 贾俊平 PowerPoint 统计学.
第八章 假设检验 本章重点: 1、正确建立零假设和备择假设 2、理解第一类错误和第二类错误 3、大样本情况下单个总体的假设检验
第四节 对数留数与辐角原理 一、对数留数 二、辐角原理 三、路西定理 四、小结与思考.
第三篇 医学统计学方法. 第三篇 医学统计学方法 医学统计学方法 实习2 主讲人 陶育纯 医学统计学方法 实习2 主讲人 陶育纯 流行病与卫生统计学教研室
主要内容 § 3.1 多维随机变量及联合分布 联合分布函里数 联合分布律 联合概率密度 § 3.2 二维随机变量的边缘分布
本讲义可在网址 或 ftp://math.shekou.com 下载
不确定度的传递与合成 间接测量结果不确定度的评估
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
线性相关分析.
第四章 抽样误差与假设检验 要求: 掌握:均数的抽样误差与标准误,t分 布的特征,t界值表,总体均数可信区间及其与参考值范围的区别。
统计学期末复习
第6章 统计量及其抽样分布 统计量 关于分布的几个概念 由正态分布导出的几个重要分布 样本均值的分布与中心极限定理 样本比例的抽样分布
复习引入 数据 统计学的核心思想是 根据样本的情况对总体的相应情况作出估计和推断 2.统计学研究问题的步骤
第三章 多维随机变量及其分布 §2 边缘分布 边缘分布函数 边缘分布律 边缘概率密度.
第13章 有序分类变量的统计推断——非参数检验
例1 :甲击中的环数; X :乙击中的环数; Y 平较高? 试问哪一个人的射击水 : 的射击水平由下表给出 甲、乙两人射击,他们
第2章 一元线性回归 2 .1 一元线性回归模型 2 .2 参数 的估计 2 .3 最小二乘估计的性质 2 .4 回归方程的显著性检验
本次课讲授:第二章第十一节,第十二节,第三章第一节, 下次课讲第三章第二节,第三节,第四节; 下次上课时交作业P29—P30
第十章 方差分析.
第七章 参数估计 7.3 参数的区间估计.
习题 一、概率论 1.已知随机事件A,B,C满足 在下列三种情况下,计算 (1)A,B,C相互独立 (2)A,B独立,A,C互不相容
数列.
抽样和抽样分布 基本计算 Sampling & Sampling distribution
模型分类问题 Presented by 刘婷婷 苏琬琳.
概 率 统 计 主讲教师 叶宏 山东大学数学院.
线 性 代 数 厦门大学线性代数教学组 2019年4月24日6时8分 / 45.
5.2 常用统计分布 一、常见分布 二、概率分布的分位数 三、小结.
非参数检验 电子工业出版社.
完全随机设计多组资料的比较 赵耐青 卫生统计教研室.
第五章 多总体的统计检验.
第4章 Excel电子表格制作软件 4.4 函数(一).
相关与回归 非确定关系 在宏观上存在关系,但并未精确到可以用函数关系来表达。青少年身高与年龄,体重与体表面积 非确定关系:
概 率 统 计 主讲教师 叶宏 山东大学数学院.
第4课时 绝对值.
第四节 随机变量函数的概率分布 X 是分布已知的随机变量,g ( · ) 是一个已知 的连续函数,如何求随机变量 Y =g(X ) 的分布?
第一部分:概率 产生随机样本:对分布采样 均匀分布 其他分布 伪随机数 很多统计软件包中都有此工具 如在Matlab中:rand
第四节 多个样本均数的两两比较 多个样本均数的两两比较又称多重比较(multiple comparison),其目的是推断究竟哪些总体均数之间存在差别。
分数再认识三 真假带分数的练习课.
§5.2 抽样分布   确定统计量的分布——抽样分布,是数理统计的基本问题之一.采用求随机向量的函数的分布的方法可得到抽样分布.由于样本容量一般不止2或 3(甚至还可能是随机的),故计算往往很复杂,有时还需要特殊技巧或特殊工具.   由于正态总体是最常见的总体,故本节介绍的几个抽样分布均对正态总体而言.
概率论与数理统计B.
第二节 函数的极限 一、函数极限的定义 二、函数极限的性质 三、小结 思考题.
第三节 随机区组设计的方差分析 随机区组设计资料的总平方和可以分解为三项: (10.10).
难点:连续变量函数分布与二维连续变量分布
第十五讲 区间估计 本次课讲完区间估计并开始讲授假设检验部分 下次课结束假设检验,并进行全书复习 本次课程后完成作业的后两部分
第十四章 假设检验 (Hypothesis Testing)
第八章 假设检验 8.3 两个正态总体参数的假设检验.
第三章 从概率分布函数的抽样 (Sampling from Probability Distribution Functions)
学习目标 1、什么是列类型 2、列类型之数值类型.
Presentation transcript:

第七章 非参数统计 非参数统计(亦称非参数检验),是根据样本资料对总体的某种性质或关系进行假设检验的统计推断方法。 主要特点 第七章 非参数统计 非参数统计(亦称非参数检验),是根据样本资料对总体的某种性质或关系进行假设检验的统计推断方法。 主要特点 不要求总体分布已知或对总体分布作任何限制性假定; 不以估计总体参数为目的; 能适用于定性变量中的定类数据或定序数据 ,也能适用于定距数据和定比数据这种定量变量 方法直观,易于理解,运算比较简单。 缺点是检验的功效不如参数检验方法。

χ2检验 主要内容 成对比较检验 曼—惠特尼U检验 游程检验 等级相关检验

χ2检验 一、什么是χ2检验 χ2检验是利用随机样本对总体分布与某种特定分布拟合程度的检验,也就是检验观察值与理论值之间的紧密程度。 设有k(K>2)个观察值,f0为它们的实际频数,fe为理论频数。构造一个统计量 其中,k-1为自由度。 皮尔生定理表明,当样本容量充分大时,样本分成K类,则χ2统计量服从χ2分布。自由度为k-1

利用样本信息对总体分布作出推断,检验总体是否服从某种理论分布(如二项分布、均匀分布或正态分布等)。 二、应用 1、拟合优度检验 利用样本信息对总体分布作出推断,检验总体是否服从某种理论分布(如二项分布、均匀分布或正态分布等)。 检验步骤 对总体分布建立假设 H0:总体服从某种理论分布 H1:总体不服从该理论分布 抽样并对样本资料编成频数分布,形成k个互斥的类型组。 (f0) 计算检验统计量 以“原假设H0为真”导出一组期望频数(fe) 比较χ2值与临界值 作出检验判断

自由度(df)=k-1-m。 其中k为组数。(各组理论频数不得小于5,如不足5,可合并相邻的组,如需合并,则k为合并后的组数) m为计算理论频数时所估计参数的个数。(未指定总体的参数,需要观察值计算相应的统计量,作为未参数的估计值) 。

用于判断两个变量是否存在交互影响。如果两个变量不存在交互影响,就称为独立,所以这类检验也称为独立性检验。 二、应用 2、独立性检验 用于判断两个变量是否存在交互影响。如果两个变量不存在交互影响,就称为独立,所以这类检验也称为独立性检验。 检验步骤 对总体的两个变量建立假设 H0:两变量独立 H1:两变量关联 将样本资料编成r×c列联表,并列出实际频数Oij 计算检验统计量 计算理论频数 比较χ2值与临界值 作出检验判断

要点说明 列联表形式(r×c) x 列(c) y 合计 1 2 3 … c 1 2 3 . r O11 O21 O31 . Or1 O12 O1c O2c O3c . Orc O1 O2 O3 . Or 行 (r) y的边缘频数 合计 n.1 n.2 n.3 … n.c n X的边缘频数

理论频数Eij的计算 先求理论频率(作为概率的近似)。概率论中关于概率独立的基本规则:如果两事件独立,则它们的联合概率等于它们各自概率的乘积,P(A·B)=P(A)·P(B)。因此,某一行某一列的联合概率: 自由度(df)的确定 df=(r-1)(c-1)

r·c=2×2的列联表资料,χ2值简算公式 x 1 2 合计 y a b a+b 1 c+d 2 c d 合计 a+c b+d n

成对比较检验 是对两个相关样本的比较分析。有符号检验和威尔科克森带符号的等级检验两种方法。 符号检验 也称正负号检验,其基本思想是分析正负号出现的频率而忽略具体量的差异,以确定他们是否有显著差异的一种检验方法。

检验步骤 1.确定配对样本,分别计算差异正与负的数目,无差异则记为0,将它从样本中剔除,并相应地减少样本容量n,把正负号数目之和视为样本总个数(n) 。 2.建立假设:H0: p=0.5 ; H1:p≠0.5 3.观察样本容量,如果n≤25,则作为二项分布处理 如果n>25,则作为正态近似处理。 4.设定显著性水平α,并查表确定临界值,进行比较和作出判断。

例 1:随机抽取12个单位,放映一部描述吸烟有害健康的影片, 并调查得到观看电影前后各单位职工认为吸烟有害的人 数的百分比。检验该电影宣传是否有效果(α=0.05)。 解:H0:P=0.5 H1:P > 0.5 P(0)=0.0002, P(1)=0.0030, P(2)=0.0161, P(3)=0.0537 P(0)+P(1)+P(2)=0.0193<0.05 P(3)+0.0193=0.0537+0.0193=0.073>0.05

可见,拒绝域应为0,1,2。 1 2 3 4 5 6 7 8 9 10 11 12 拒绝域 现检验统计量(-)=3 (即3个负号),0.073>0.05所以,原假设H0:P=0.5在5%显著性水平上不能被拒绝。也即不能认为职工在观看影片前后的认识有显著提高。

例2:随机抽取60名消费者对甲、乙两种品牌的饮料评 分,甲 、乙得分之差为“+”号者35个,“-”号15 个,“0”号10个。以显著性水平α=0.05检验两种饮料是否同等受欢迎。 解:H0:P=0.5, H1:P≠0.5 ∵n>25,∴按正态分布近似处理 该成数抽样分布的均值和标准差分别为 2.82>1.96,所以,拒绝原假设。认为两种饮料并不受到同等欢迎。且乙种优于甲种。

这种检验方法不仅考虑了两组数据差异的正、负号,而且还利用了其差异大小的信息。因此,是一种更为有效的检验方法。 威尔科克森带符号的等级检验 这种检验方法不仅考虑了两组数据差异的正、负号,而且还利用了其差异大小的信息。因此,是一种更为有效的检验方法。 1、应用条件和检验内容与符号检验相同。 2、方法思想:若关联样本的两组数据没有显著差异,则不仅其差异的正、负符号应大致相等,而且将其差的数值按大小顺序排列编自然序号(即秩)后,它们的正号(+)的秩和(记为T+)与负号(-)的秩和(记为T-)也应该大致相等。其中之较小者也应趋近于总秩和的平均数( )。若正秩和(T+)与负秩和(T-)相差太大,其中较小者偏离总秩和的平均( )较远,以致超过给定显著性水平α所确定的临界点,就可以认为这两组数据存在显著差异,即总体的分布不相同。

检验步骤 将样本数据配对并计算各对正负差值 将差数取绝对值按从小到大顺序排列并编上等级,即确定顺序号1、2、3等。对于相等的值,则取其位序的平均数为等级 建立假设:H0:T+= T- ; H1 : T+ ≠T-(双侧) H1 :T+>T-或T+<T-(单侧) 计算检验统计量: 当n>25时 当n≤25时,取T+、T-中之小者

设定α,并查表确定临界值Tα(或Zα/2) 比较检验值与临界值 作出判断,对于n≤25,T≤Tα, 拒绝H0; T>Tα, 接受H0 接受区域 拒绝区域 Tα=5 =22.5 Tα=40 拒绝区域

曼—惠特尼U检验 曼—惠特尼U检验适用于从两个总体中分别独立抽取两个样本的检验,方法思想与威尔科克森秩和检验相同。 检验步骤: 从总体A、B中分别独立抽取样本nA和nB,将(nA+nB)个观察值从小到大编序 分别计算两个样本,的秩和TA和TB 建立假设H0:两总体A和B相对次数分布相同 H1:两总体相对次数分布不同

计算检验统计量 ①nA、nB<10时,取UA、UB中小者 UA= nAnB+ nA(nA +1)/2-TA UB= nAnB+ nB(nB +1)/2-TB ②nA、nB>10时 设定显著性水平α,查U表或Z表得到临界值 比较统计量与临界值,作出判断, 对于nA、nB<20 U≤Uα,拒绝H0, U>Uα,接受H0

游程检验 一、什么是游程检验 (i) r=5, (ii) r=2, (iii) r=11 游程检验(亦称连贯检验)是根据样本标志表现排列所形成的游程的多少进行判断的检验方法。 设某样本n=12人的标志表现为男、女,有以下三种排列。 (i) 男,男,女,女,女,男,女,女,男,男,男,男 (ii) 男,男,男,男,男,男,男,女,女,女,女,女 (iii) 男,女,男,女,男,女,男,女,男,女,男,男 连续出现男或女的区段称为游程。每个游程包含的个数为游程长度。以r表示序列中游程的个数: (i) r=5, (ii) r=2, (iii) r=11

(i)是随机性序列;(ii)(iii)是非随机性序列,所以,可以用游程的个数来检验样本的随机性,或总体的分布特征。 二、游程检验方法 1.检验总体分布是否相同。 将从两个总体中独立抽取的两个样本的观察值混合有序后,观察游程个数,进行比较。 2.检验样本的随机性 将取自某一总体的样本的观察值按从小到大顺序排列,找出中位数(或平均数),分为大于中位数的小于中位数的两个部分。用上下交错形成的游程个数来检验样本是否是随机的。

3.检验规则(小样本,n1与n2都小于20) 应用表La和Lb,(α=0.05,r为临界值) (1)单侧检验: 观察到的游程个数 ro≤临界值(La表) 否定Ho 或ro≥临界值(Lb表) 反之,接受Ho。 (2)双侧检验: 观察到的游程个数ro r(La)<ro<r(Lb) 接受Ho 下限 上限 反之,拒绝Ho

4.大样本(n1或n2大于20),游程个数r近似正态分布 检验统计量 其中:

等级相关检验 一、等级相关检验的基本原理 将两组变量按顺序等级排列,在等级的基础上计算等级相关系数,从而反映两组变量之间联系的密切程度。 等级相关系数的计算公式 其中di为两变量每一对样本的等级之差,n为样本容量。 等级相关系数与相关系数一样,取值-1到+1之间,区别是它是建立在等级的基础上计算的,较适用于反映序列变量的相关。

二、等级相关系数的应用 利用斯皮尔曼等级相关系数,可以对两序列变量是否相关进行检验。 (一)检验的假设 (1)H0:rs=0 , Xi和Yi 相互独立; H1:Xi和Yi不独立。(此为双侧检验) (2)H0: rs=0 ,Xi和Yi相互独立; H1: Xi和Yi是正相关。(即Xi的大值与Yi的大值相配对) (3)H0: rs=0 ,Xi和Yi相互独立; H1:Xi和Yi是负相关。(即Xi的大值与Yi的小值相配对)

(二)检验统计量: