检验 Chi-Squared Test Goodness-of-fit Test 拟合优度检验 & Test of Row and Column Independenc 独立性检验 欧阳顺湘 2005.6.25 北京师范大学珠海分校
c2分布 (图示) c 2 n=1 n=4 n=10 n=20 欧阳顺湘 2005.6.25 北京师范大学珠海分校 The sampling distribution is a function of the sample sizes upon which the sample variances are based. Hint: Recall the formula for variance! s2 = S(x -`x)2/(n-1) c 2 欧阳顺湘 2005.6.25 北京师范大学珠海分校 65
前面讨论了当总体分布为正态时,关于其中未知参数的假设检验问题 . 然而可能遇到这样的情形,总体服从何种理论分布并不知道,要求我们直接对总体分布提出一个假设 . 举例:用 Excel 演示投掷硬币的检验 欧阳顺湘 2005.6.25 北京师范大学珠海分校
又如,某钟表厂对生产的钟进行精确性检查,抽取100个钟作试验,拨准后隔24小时以后进行检查,将每个钟的误差(快或慢)按秒记录下来. 问该厂生产的钟的误差是否服从正态 分布? 欧阳顺湘 2005.6.25 北京师范大学珠海分校
为检验骰子是否均匀,要把骰子实地投掷若干次,统计各点出现的频率与1/6的差距. 再如,某工厂制造一批骰子,声称它是均匀的. 也就是说,在投掷中,出现1点,2点,…,6点的概率都应是1/6. 为检验骰子是否均匀,要把骰子实地投掷若干次,统计各点出现的频率与1/6的差距. 问题是: 得到的数据能否说明“骰子均匀” 的假设是可信的? 欧阳顺湘 2005.6.25 北京师范大学珠海分校
解决这类问题的工具是英国统计学家K.皮尔逊在1900年发表的一篇文章中引进的所谓 检验法. 这是一项很重要的工作,不少人把它视为近代统计学的开端. 欧阳顺湘 2005.6.25 北京师范大学珠海分校
根据来自总体的样本,检验关于总体分布的假设的一种检验方法. 检验法是在总体X 的分布未知时, 根据来自总体的样本,检验关于总体分布的假设的一种检验方法. 欧阳顺湘 2005.6.25 北京师范大学珠海分校
然后根据样本的经验分布和所假设的理论分布之间的吻合程度来决定是否接受原假设. 检验法 使用 对总体分布进行检验时, 我们先提出原假设: H0:总体X的分布函数为F0(x) 然后根据样本的经验分布和所假设的理论分布之间的吻合程度来决定是否接受原假设. 这种检验通常称作拟合优度检验,它是一种非参数检验. 欧阳顺湘 2005.6.25 北京师范大学珠海分校
在用 检验假设H0时,若在H0下分布类型已知,但其参数未知,这时需要先估计参数,然后作检验. 检验法 分布拟合的 的基本原理和步 骤如下: 检验法 欧阳顺湘 2005.6.25 北京师范大学珠海分校
1. 将总体X的取值范围分成 r 个互不重迭的小区间[ai-1,ai], i=1,…r, 记作A1, A2, …, Ar . 2.把落入第k个小区间Ak的样本值的个数记作 nk , 称为实际频数. 3.根据所假设的理论分布,可以算出总体X的值落入每个Ak的概率pk,于是npk就是落入Ak的样本值的理论频数. 欧阳顺湘 2005.6.25 北京师范大学珠海分校
标志着经验分布与理论分布之间的差异的大小. 实际频数 理论频数 标志着经验分布与理论分布之间的差异的大小. 皮尔逊引进如下统计量表示经验分布 与理论分布之间的差异: 在理论分布 已知的条件下, npk是常量 统计量 的分布是什么? 欧阳顺湘 2005.6.25 北京师范大学珠海分校
皮尔逊证明了如下定理: 的分布渐近(r-1)个自由度的 分布. 若原假设中的理论分布F0(x)已经完全给定,那么当 时,统计量 的分布渐近(r-1)个自由度的 分布. 如果理论分布F0(x)中有m个未知参数需用相应的估计量来代替,那么当 时,统计量 的分布渐近 (r-m-1) 个自由度 的 分布. 欧阳顺湘 2005.6.25 北京师范大学珠海分校
查 分布表可得临界值 得拒绝域: (不需估计参数) (估计 r 个参数) 查 分布表可得临界值 ,使得 根据这个定理,对给定的显著性水平 , 得拒绝域: (不需估计参数) (估计 r 个参数) 如果根据所给的样本值 X1,X2, …,Xn算得统计量 的实测值落入拒绝域,则拒绝原假设,否则就认为差异不显著而接受原假设. 欧阳顺湘 2005.6.25 北京师范大学珠海分校
皮尔逊定理是在n无限增大时推导出来的,因而在使用时要注意n要足够大,以及npi 不太小这两个条件. 根据计算实践,要求n不小于50,以及npi 都不小于 5. 否则应适当合并区间,使npi满足这个要求 . 欧阳顺湘 2005.6.25 北京师范大学珠海分校
在此,我们以遗传学上的一项伟大发现为例,说明统计方法在研究自然界和人类社会的规律性时,是起着积极的、主动的作用. 孟德尔 奥地利生物学家孟德尔进行了长达八年之久的豌豆杂交试验, 并根据试验结果,运用他的数理知识, 发现了遗传的基本规律. 欧阳顺湘 2005.6.25 北京师范大学珠海分校
子二代 子一代 … 他的一组观察结果为: 黄70,绿27 近似为2.59:1,与理论值相近. 黄色纯系 绿色纯系 根据他的理论,子二代中, 黄、绿之比 近似为3:1, 他的一组观察结果为: 黄70,绿27 近似为2.59:1,与理论值相近. 欧阳顺湘 2005.6.25 北京师范大学珠海分校
由于随机性,观察结果与3:1总有些差距,因此有必要去考察某一大小的差异是否已构成否定3:1理论的充分根据,这就是如下的检验问题. 检验孟德尔的3:1理论: 提出假设H0: p1=3/4, p2=1/4 这里,n=70+27=97, k=2, 理论频数为: np1=72.75, np2=24.25 实测频数为70,27. 欧阳顺湘 2005.6.25 北京师范大学珠海分校
统计量 ~ 按 =0.05,自由度为1,查 分布表得 =3.841 的实测值 由于统计量 =0.4158<3.841, 未落入否定域. k-1=1 统计量 ~ 按 =0.05,自由度为1,查 分布表得 =3.841 由于统计量 的实测值 =0.4158<3.841, 未落入否定域. 故认为试验结果符合孟德尔的3:1理论. 欧阳顺湘 2005.6.25 北京师范大学珠海分校
这些试验及其它一些试验,都显 示孟德尔的3: 1理论与实际是符合的. 这本身就是统计方法在科学中的一项 重要应用. 这些试验及其它一些试验,都显 示孟德尔的3: 1理论与实际是符合的. 这本身就是统计方法在科学中的一项 重要应用. 用于客观地评价理论上的某个结论是否与观察结果相符,以作为该理论是否站得住脚的印证. 欧阳顺湘 2005.6.25 北京师范大学珠海分校
某地英语高考测验题共105道, 要求这些题目的难度分布为: 要求 实际值 0~0.3之间 0.15 9 0.3~0.7之间 0.70 81 要求 实际值 0~0.3之间 0.15 9 0.3~0.7之间 0.70 81 0.7~ 1之间 0.15 15 问实测结果与难度的理想分布有无显著差异?(=0.05) 难度满足: P(00.3)=0.15 P(0.30.7)=0.70 P(0.11)=0.15 欧阳顺湘 2005.6.25 北京师范大学珠海分校
某地英语高考测验题共105道, 要求这些题目的难度分布为: 要求 实际值 0~0.3之间的16题 9 0.3~0.7之间的73题 81 要求 实际值 0~0.3之间的16题 9 0.3~0.7之间的73题 81 0.7~1之间的16题 15 问实测结果与难度的理想分布有无显著差异?(=0.05) 参考: Excel 演示 欧阳顺湘 2005.6.25 北京师范大学珠海分校
独立性检验: Excel 演示 欧阳顺湘 2005.6.25 北京师范大学珠海分校
The End Exercise: Page 154 16 欧阳顺湘 2005.6.25 北京师范大学珠海分校