统 计 学 (第三版) 2008 作者 贾俊平 统计学
对正确问题的近似答案,胜过对错的问题的精确答案。 ——John W.Tukey 统计名言 对正确问题的近似答案,胜过对错的问题的精确答案。 ——John W.Tukey 2008年8月
13.1 单样本的检验 13.2 两个及两个以上样本的检验 13.3 秩相关及其检验 第 13 章 非参数检验 13.1 单样本的检验 13.2 两个及两个以上样本的检验 13.3 秩相关及其检验
学习目标 非参数检验及其用途 单样本的非参数检验方法 两个及以上样本的非参数检验方法 秩相关及其检验方法 用SPSS进行非参数检验 非参数检验与参数检验的比较 As a result of this class, you will be able to ... 2008年8月
不同商圈的报纸发行量是否有差异? 华夏时报》自称是中国第一份商圈社区报,精准覆盖北京636座写字楼(公寓)70000实名精英读者的精神咖啡 2005年8月29日的华夏时报公布了该报最新的发行量数据,并声明是“最新发行数据诚信公告” 国贸—京广 建国门—王府井 燕莎 西单—金融街 中关村 亚奥 990 59 291 218 10 67 20 126 42 196 60 44 50 250 89 8 52 265 39 118 289 18 11 125 22 103 40 182 54 78 53 171 92 43 30 47 77 35 57 48 144 217 160 168 151 109 134 181 90 51 150 3 64 548 139 13 26 23 62 12 16 15 93 2008年8月
不同商圈的报纸发行量是否有差异? 要检验不同商圈的发行量是否有显著差异,可以采用方差分析方法。但该方法假定每个商圈在不同发行点的发行量应服从正态分布,且方差相等 实际上,这些假定很难得到满足。比如,对上述数据所做的正态分布检验表明,亚奥商圈的发行量就不满足正态分布(P=0.018<0.05) 非参数方法就不需要这些假定,照样可以得到比较满意的检验结果。比如,对上述数据所做的Kruskal-Wallis检验得到的(P=0.355>0.05),没有证据表明不同商圈的报纸发行量之间存在显著差异 2008年8月
第 13 章 非参数检验 13.1 单样本的检验 13.1.1 总体分布类型的检验 13.1.2 中位数的符号检验 第 13 章 非参数检验 13.1 单样本的检验 13.1.1 总体分布类型的检验 13.1.2 中位数的符号检验 13.1.3 Wilcoxon符号秩检验
13.1 单样本的检验 13.1.1 总体分布类型的检验
总体分布类型的检验 (二项分布检验) 二项分布检验(binomial test)是通过考察二分类变量的每个类别中观察值的频数与特定二项分布下的期望频数之间是否存在显著差异,来判断抽取样本所依赖的总体是否服从特定概率为P的二项分布 二项分布检验的原假设是:抽取样本所依赖的总体与特定的二项分布无显著差异 根据二项分布知识,一个服从二项分布的随机变量,在n次试验中,出现“成功”的次数的概率为 若“成功”的次数的概率小于给定的显著性水平,则拒绝原假设,表明抽取样本所依赖的总体与特定概率为p的二项分布有显著差异(样本数据不是来自某个特定概率为p的二项分布) 2008年8月
总体分布类型的检验 (二项分布检验) 【例13.1】根据以往的生产数据,某种产品的合格率为90%。现从中随机抽取25个进行检测,合格品为20个。检验该批产品的合格率是否为90%?(产品合格率X~B(n,0.9)) SPSS的数据格式 表中的“1”表示合格品;“0”表示不合格品 合格品 频数 1 20 5 2008年8月
总体分布类型的检验 (SPSS binomial test) 第1步:指定“频数”变量:点击【Data】【Weight- Cases】,将“频数”选入【Frequency Variable】 【OK】 第2步:选择【Analyze】【Nonparametric Tests-Binomial】选项进入主对话框 第3步:将待检验的变量选入【Test Variable List】(本例为“合格品”) 第4步:在【Test Proportion】中输入检验的概率 (本例为0.9),点击【OK】 2008年8月
总体分布类型的检验 (SPSS binomial test) 2008年8月
总体分布类型的检验 (K-S检验) 单样本的K-S检验(Kolmogorov-Smirnov检验)是用来检验抽取样本所依赖的总体是否服从某一理论分布 其方法是将某一变量的累积分布函数与特定的分布进行比较。设总体的累积分布函数为F(x),已知的理论分布函数为F0(x) ,则检验的原假设和备择假设为 H0: F(x)=F0(x) ; H1: F(x)≠F0(x) 原假设所表达的是:抽取样本所依赖的总体与指定的理论分布无显著差异 SPSS提供的理论分布有正态分布、Poisson分布、均匀分布、指数分布等 2008年8月
总体分布类型的检验 (K-S检验) 【例13.2】沿用第7章的例7.7。对某汽车配件提供商提供的10个样本进行检测,得到其长度数据如下(单位:cm) 检验该供货商生产的配件长度是否服从正态分布?(=0.05) 12.2 10.8 12.0 11.8 11.9 12.4 11.3 12.3 2008年8月
总体分布类型的检验 (SPSS K-S检验) 第1步:选择【Analyze】【Nonparametric Test】【1-Sample K-S】进入主对话框 第2步:将待检验的变量选入【Test Variable List】(本例为“配件长度”) 第3步:点击【Exact】,并在对话框中选择 【Exact】,点击【OK】 2008年8月
总体分布类型的检验 (SPSS K-S检验) 精确双尾概率为0.602>0.05,不拒绝原假设。没有证据表明该供货商提供的汽车配件长度不服从正态分布 2008年8月
13.1 单样本的检验 13.1.2 中位数的符号检验
中位数的符号检验 (sign test) 检验总体中位数是否等于某个假定的值 设一个随机样本有n个数据,总体中位数的实际值为M,假设的总体中位数值为M0。当样本中的数据大于假设的中位数时,用“+”号表示,小于假设的中位数时,用“-”表示;对于恰好等于假设的中位数的数据予以剔出 若关心实际的M与假设的M0是否有差别,应建立假设 H0: M=M0 ; H1: M≠M0 计算检验统计量S+和S-。S+表示每个样本数据与M0与差值符号为正的个数;S-表示每个样本数据与M0差值符号为负的个数 计算P值并作出决策。若P<,拒绝原假设 2008年8月
中位数的符号检验 (sign test) 【例13.3】某企业生产一种零件,规定其长度的中位数为15厘米,现从某天生产的一批零件中随机抽取16只,测得其长度(单位:cm)如下 检验该企业生产零件的中位数与15cm是否有显著差异?(=0.05) 15.1 14.5 14.8 14.6 15.2 15.3 14.7 15.0 2008年8月
中位数的符号检验 (SPSS sign test) 第1步:选择【Analyze】【Nonparametric Tests-Binomial】选项进入主对话框 第2步:将待检验的变量选入【Test Variable List】(本例为“零件长度”) 第3步:点击【Define Dichotomy】,中在【Cut point】框中输入总体中位数的假设值15, 在【Test Proportion】框内输入二项分布的参 数0.5,点击【OK】 2008年8月
中位数的符号检验 (SPSS sign test) 零件长度小于等于中位数的有10个,大于中位数的只有6个。而参数为(16,0.5)的二项分布变量大于等于15的概率为0.227。精确双尾概率为P=0.454>0.05,不拒绝原假设。没有证据表明该企业生产零件的实际中位数与15cm有显著差异 (使用SPSS中的【Nonparametric Tests-2 Related Samples】选项也可以作上述检验) 2008年8月
13.1 单样本的检验 13.1.3 Wilcoxon符号秩检验
秩的概念 (rank) 秩就是一组数据按照从小到大的顺序排列之后,每一个观测值所在的位置 也是一个统计量,它测度的是数据观测值的相对大小,大多数非参数检验方法正是利用秩的这一性质来排除总体分布未知的障碍的。当然,也有一些非参数方法并不涉及秩的性质 2008年8月
结的处理 (ties) 很多情况下,数据中会出现相同的观测值,那么对它们进行排序后,这些相同观测值的排名显然是并列的,也就是说它们的秩是相等的,这种情况被称为数据中的“结” 对于结的处理,通常是以它们排序后所处位置的平均值作为它们共同的秩 当一个数据中结比较多时,某些非参数检验中原假设下检验统计量的分布就会受到影响,从而需要对统计量进行修正(一般情况下,软件会自动作出修正) 2008年8月
Wilcoxon符号秩检验 (Wilcoxon signed ranks test) 检验总体参数(如中位数)是否等于某个假定的值。它是对符号检验的一种改进,弥补了符号检验的不足,要比单纯的符号检验更准确一些(对应的参数检验—单样本均值检验) 检验步骤 计算各样本观察值与假定的中位数的差值,并取绝对值 将差值的绝对值排序,并找出它们的秩 计算检验统计量和P值,并作出决策 2008年8月
Wilcoxon符号秩检验 (SPSS Wilcoxon test) 第1步:选择【Analyze】【Nonparametric Tests-2 Related Samples 】主对话框 第2步:将两个变量同时选入【Test Pair(s) List】,(“零件长度”和“假设中位数”) 第3步:在【Test Type】下选择【Wilcoxon】, 点击【Exact】并选择【Exact】,返回主 对话框,点击【OK】 2008年8月
Wilcoxon符号秩检验 (SPSS Wilcoxon test) 精确的双尾概率为0.126,不拒绝原假设。没有证据表明零件的实际中位数与15cm有显著差异 2008年8月
第 13 章 非参数检验 13.2 两个及两个以上样本的检验 13.2.1 两个配对样本的Wilcoxon符号秩检验 第 13 章 非参数检验 13.2 两个及两个以上样本的检验 13.2.1 两个配对样本的Wilcoxon符号秩检验 13.2.2 两个独立样本的Mann-Whitney检验 13.2.3 k个独立样本的Kruskal-Wallis检验
13.2.1 两个配对样本的Wilcoxon符号秩检验 13.2 两个及两个以上样本的检验 13.2.1 两个配对样本的Wilcoxon符号秩检验
两个配对样本 Wilcoxon符号秩检验 检验两个总体的分布是否相同,或者说两个总体的中位数是否相同 对应的参数方法—两个配对样本的t检验 提出的假设为 H0: Md=0 ;H1: Md≠0 (Md表示差值的中位数) 检验步骤 计算各数据对的差值di,并取绝对值,排序后求出秩 计算检验统计W或z 根据P值作出决策 2008年8月
两个配对样本 Wilcoxon符号秩检验 检验统计量 小样本情况下,统计量 服从Wilcoxon符号秩分布 大样本情况下,统计量 近似服从正态分布 2008年8月
两个配对样本 Wilcoxon符号秩检验 【例13.5】一家制造企业准备采用一种新的方法生产产品,为确定新方法与旧方法生产的产品数量是否相同,随机抽取10个工人,每个工人分别使用新旧两种方法生产产品。10个工人采用两种生产的产品数量如下。检验新旧两种方法所生产的产品数量是否有显著差异? (=0.05) 工人 1 2 3 4 5 6 7 8 9 10 旧方法 12 14 13 11 17 16 新方法 19 15 18 2008年8月
两配对样本Wilcoxon符号秩检验 (SPSS Wilcoxon test) 第1步:选择【Analyze】【Nonparametric Tests-2 Related Samples 】主对话框 第2步:将两个变量同时选入【Test Pair(s) List】,(“旧方法”和“新方法”) 第3步:在【Test Type】下选择【Wilcoxon】, 点击【Exact】并选择【Exact】,返回主 对话框,点击【OK】 2008年8月
两配对样本Wilcoxon符号秩检验 (SPSS Wilcoxon test) 统计量为-2.296,精确的双尾P=0.021<0.05, 拒绝H0,两种方法生产的产品数量有显著差异 2008年8月
13.2.2 两个独立样本的Mann-Whitney检验 13.2 两个及两个以上样本的检验 13.2.2 两个独立样本的Mann-Whitney检验
两个独立样本 Mann-Whitney检验 也称为Mann-Whitney U检验(Mann-Whitney U test),或称为Wilcoxon秩和检验 用于确定两个总体间是否存在差异的一种非参数检验方法(对应的参数方法—两个独立样本的t检验或z检验) Mann-Whitney检验不需要诸如总体服从正态分布且方差相同等之类的假设,但要求是两个独立随机样本的数据至少是顺序数据 与Wilcoxon符号秩检验不同,它不是基于相关样本,而是使用两个独立样本 2008年8月
两个独立样本 Mann-Whitney检验 设X、Y是两个连续的总体,其累积分布函数为Fx和Fy,从两个总体中分别抽取两个独立样本:(x1,x2,…,xm)和(y1,y2,…,yn) 若要检验两个总体是否相同,提出如下假设 H0 :两个总体相同,H1 :两个总体不相同 或等价于 H0:Mx=My ;H1:Mx≠My 2008年8月
两个独立样本 Mann-Whitney检验 检验步骤 把两组数据混合在一起,得到m+n=N个数据,并找出N个数据的秩 分别对样本(x1,x2,…,xm)和(y1,y2,…,yn)的秩求出平均秩,得到两个平均秩 和 ,并对平均秩的差距进行比较:若二者相差甚远,意味着一组样本的秩普遍偏小,另一组样本的秩普遍偏大,此时原假设有可能不成立 计算样本(x1,x2,…,xm)中每个秩大于样本(y1,y2,…,yn)的每个秩的个数 ,以及样本(y1,y2,…,yn)中每个秩大于样本(x1,x2,…,xm)中每个秩的个数 2008年8月
两个独立样本 Mann-Whitney检验 检验步骤 计算Wilcoxon统计量W和Mann-Whitney统计量U 分别求出两个样本的秩的和,Wx和Wy。若m<n,检验统计量W=Wx ;若m>n,统计量W=Wy ;若m=n,统计量为第一个变量值所在样本组的W值 Mann-Whitney统计量定义为 小样本情况下,统计量服从Mann-Whitney分布,大样本情况下,近似服从正态分布,检验统计量为 根据P值作出决策 (k为W对应样本组的样本数据个数) 2008年8月
两个独立样本 Mann-Whitney检验 【例13.6】8亚洲国家和8个欧美国家2005年的人均国民收入数据如下。检验亚洲国家和欧美国家的人均国民收入是否有显著差别 ? (=0.05) 亚洲国家 人均国民总收入 欧美国家 中国 1740 美国 43740 日本 38980 加拿大 32600 印度尼西亚 1280 德国 34580 马来西亚 4960 英国 37600 泰国 2750 法国 34810 新加坡 27490 意大利 30010 韩国 15830 墨西哥 7310 印度 720 巴西 3460 2008年8月
两个独立样本 (SPSS Mann-Whitney test) 第1步:选择【Analyze】【Nonparametric Tests-2 Independent Samples】主对话框 第2步:将待检验变量选入【Test Variable List】, (本例为“人均国民收入”);将分类变量选入的 【Grouping Variable】框内(本例为“国家”), 点击进入【Define Groups】分别输入类别代 码“1”和“2”,返回主对话框 第3步:在【Test Type】下选择【Mann-Whitney U】,点击【Exact】并选择【Exact】,返回 主对话框,点击【OK】 2008年8月
两个独立样本 (SPSS Mann-Whitney test) 2008年8月
13.2.3 k个独立样本的Kruskal-Wallis检验 13.2 两个及两个以上样本的检验 13.2.3 k个独立样本的Kruskal-Wallis检验
k个独立样本 Kruskal-Wallis检验 用于检验多个总体是否相同(对应的参数方法—方差分析) Kruskal-Wallis检验不需要总体服从正态分布且方差相等这些假设 该检验可用于顺序数据,也可用于数值型数据 要检验k个总体是否相同,提出如下假设 H0 :所有总体都相同,H1 :并非所有总体都相同 或等价于 H0:M1=M2 =…=Mk H1:M1,M2 ,…,Mk 不全相同 2008年8月
k个独立样本 Kruskal-Wallis检验 检验步骤 将所有样本的观察值混合在一起,找出每个观察值在N个数据中的秩 计算检验统计量 当每个样本的容量均大于等于5时,检验的统计量H的抽样分布近似自由度为k-1的2分布。若P<,则拒绝H0,表明k个总体是不全相同的 2008年8月
k个独立样本 Kruskal-Wallis检验 【例13.7】为比较3所大学的英语教学质量,分别从大学A抽取7名学生、大学B抽取6名学生、大学C抽取8名学生,采用同一份试题进行考试,得到考试分数的数据如表。试评价3所大学的英语教学质量是否有显著差异? (=0.05) 大学A 大学B 大学C 61 75 89 85 62 63 78 76 80 66 98 65 70 86 77 95 73 71 69 84 58 2008年8月
k个独立样本 (SPSS Kruskal-Wallis) 第1步:选择【Analyze】【Nonparametric Tests-k Independent Samples】主对话框 第2步:将待检验的变量选入【Test Variable List】, (本例为“考试成绩”),将分类变量选入 【Grouping Variable】框内(本例为“大学”), 点击进入【Define Groups】,将代码最小值 1输入【Minimum】,最大值3输入 【Maximum】,返回主对话框 第3步:在【Test Type】下选择【Kruskal-Wallis】, 点击【OK】 2008年8月
k个独立样本 (SPSS Kruskal-Wallis) 渐进的双尾P值为0.778,不拒绝H0,没有证据表明3所大学的英语考试成绩之间存在显著差异 2008年8月
第 13 章 非参数检验 13.3 秩相关及其检验 13.3.1 Spearman秩相关及其检验 13.3.2 Kendall秩相关及其检验
13.3 秩相关及其检检验 13.3.1 Spearman秩相关及其检验
Spearman秩相关检验 对两个顺序变量之间相关程度的一种度量 Spearman秩相关系数也称等级相关系数,记为rs,计算公式为 rs=1,两种排序之间完全相关;若-1<rs<0,两种排序之间为负相关;若0<rs<1,两种排序之间为正相关;若rs=0,两种排序之间不相关 rs越趋于1,相关程度越高;越趋于0,相关程度越低 2008年8月
Spearman秩相关检验 【例13.8】在一项关于职业声望和可信赖程度的调查中,列举了12种职业,要求被调查者分别按声望高低和值得信赖程度进行排序,调查数据如表计算两种排序之间的Spearman秩相关系数,并进行检验。 (=0.01) 职业 声望排序 信赖程度排序 科学家 医生 工程师 政府官员 中小学教师 大学教师 新闻记者 律师 企业管理人员 银行管理人员 建筑设计人员 会计师 1 2 6 3 4 5 7 8 9 10 11 12 2008年8月
Spearman秩相关检验 (SPSS Spearman) 第1步:选择菜单: 【Analyze】【Correlate】【Bivariate】 第2步:将两个变量选入【Variable】 在【Correlation Coefficients】下选择 【Spearman】 在【Test of Significance】下选择双侧检验 【Two-tailed】或单侧检验【One-tailed】 (在此我们以:声望排序与信赖程度排序之 间不存在显著相关,进行双侧检验),点击 【OK】 2008年8月
Spearman秩相关检验 (SPSS Spearman) Spearman秩相关系数为0.860,两种排序之间有比较高的正相关,即职业声望越高,值得信赖的程度也就越高。双尾检验的P=0.000,拒绝原假设,表明声望排序与信赖程度排序之间存在显著的相关关系 2008年8月
13.3 秩相关及其检检验 13.3.2 Kendall秩相关及其检验
Kendall秩相关检验 或 对两个序变量之间相关程度的一种度量 Kendall秩相关系数记为 ,计算公式为 的取值范围为[-1,1] U表示 y 的一致对数目,V表示 y 非的一致对数目 的取值范围为[-1,1] 若 =1,表明两组秩之间完全正相关 若 =-1,表明两组秩之间完全正相关 2008年8月
Kendall秩相关检验 (SPSS Kendall) Spearman秩相关系数 =0.679,两种排序之间有比较高的正相关。双尾检验的P=0.002,拒绝原假设,表明声望排序与信赖程度排序之间存在显著的相关关系 2008年8月
本章小节 非参数检验 用途 参数检验 二项分布检验 检验抽取样本所依赖的总体是否服从特定概率的二项分布 无 Kolmogorov-Smirnov 检验(K-S检验) 检验抽取样本所依赖的总体是否服从某一理论分布 符号检验 检验一个总体位置参数是否等于某假定值 单总体均值的t或z检验 Wilcoxon符号秩检验 两个配对样本 检验配对数据的总体位置参数是否相同 双总体均值的t或z检验(匹配样本) 两个独立样本 Mann-Whitney检验 检验两个总体位置参数是否相同 双总体均值的t或z检验(独立样本) k个独立样本 Kruskal-Wallis检验 检验多个总体是否相同 方差分析 秩相关及其检验 检验两个变量的相关性 线性相关系数及其检验 As a result of this class, you will be able to ... 2008年8月
本章小节 非参数检验及其用途 单样本的非参数检验方法 两个及以上样本的非参数检验方法 秩相关及其检验方法 用SPSS进行非参数检验 非参数检验与参数检验的比较 As a result of this class, you will be able to ... 2008年8月
结 束 THANKS