理论联系实践 理论就是, 什么都懂,但什么都不会用 实践就是, 什么都不懂,却什么都会用 理论联系实践就是, 什么都不会用

Slides:



Advertisements
Similar presentations
简单迭代法的概念与结论 简单迭代法又称逐次迭代法,基本思想是构造不动点 方程,以求得近似根。即由方程 f(x)=0 变换为 x=  (x), 然后建立迭代格式, 返回下一页 则称迭代格式 收敛, 否则称为发散 上一页.
Advertisements

渡黑水溝 郁永河. 2 戎克船:是明末清初時期往返兩岸的主要交通工具 ∗ 1. 關於台灣的開發歷史,我們到底了解多少呢?不妨試著說出 就我們所知有關台灣開發史的故事、小說、電影、音樂與大 家分享。 ∗ 2. 什麼是黑水溝?黑水溝為什麼會成為大陸移民渡海來臺時最 大的威脅? ∗ 3. 有聽過「六死三留一回頭」、「有唐山公,無唐山嬤」這兩.
南 通. 南通概述 南通,位于江苏省东部, 东抵黄海,南望长江。 “ 据江 海之会、扼南北之喉 ” ,隔江 与中国经济最发达的上海及 苏南地区相依,被誉为 “ 北上 海 ” 。 南通也是中国首批对 外开放的 14 个沿海城市之一 ,被称为 “ 中国近代第一城 ” 。 南通面临海外和内陆两大经 济辐射扇面,素有.
高等学校英语应用能力考试 考务培训 兰州文理学院教务处 2014 年 12 月. 考务培训 21 日请监考人员上午 8:00 (下午 2:30 )到综合楼 205 教室集合,查看 监考安排,由考务负责人进行考务 培训。
語言與文化通識報告 - 台日年菜差異 - 指導老師 : 葉蓁蓁 小組 : 日本微旅行 組員 :4a21b032 吳采玲 4a21b037 沈立揚 4a 洪雅芳 4a 陳楚貽 4a 王巧稜.
均衡推进,确保质量 08学年第一学期教学工作会议 广州市培正中学
黑木耳.
投資權證13問 交易所宣導資料(104) 1.以大盤指數為標的之權證,和大盤指數的連動性,為什麼比和期交所期指的連動性差?
如何把作文写具体.
第一章 人口与环境 第一节 人口增长模式.
第一节 人口与人种 第一课时.
解读我党发展史 思索安惠美好明天 主讲人:王辰武.
专利技术交底书的撰写方法 ——公司知识产权讲座
第5课 长江和黄河.
報告書名:父母會傷人 班級:二技幼四甲 姓名:吳婉如 學號:1A2I0034 指導老師:高家斌
銓敘部研究規劃自願退休公務人員月退休金起支年齡延後方案座談會
瓦罐湯 “瓦缸煨汤”是流行于南方民间的一种风味菜肴。它采用一种制特的大瓦缸,其缸底可以烧火,缸内置有铁架,厨师将装有汤的小瓦罐一层层地码入缸内的铁架上,然后点燃木炭,借用木炭火产生的高温将瓦罐内的汤煨熟。
幼 兒 遊 戲 訪 談 組別:第七組 班級:幼保二甲 姓名:4A0I0008劉俐音 4A0I0043吳碧娟 4A0I0059劉又甄 4A0I0060江佳霓 4A0I0061蕭靖霓 4A0I0079王毓君.
1.數學的難題 如下圖所示,你知道表格中的問號應填入什麼數字嗎?
第九章 欧氏空间 §1 定义与基本性质 §2 标准正交基 §3 同构 §4 正交变换 §5 子空间 §6 对称矩阵的标准形
第九章 欧氏空间 §1 定义与基本性质 §6 对称矩阵的标准形 §2 标准正交基 §7 向量到子空间的 距离─最小二乘法 §3 同构
合肥学院外国语言系2012年度 学生工作表彰大会.
105年基北區高中職適性入學宣導 教育會考後相關作業說明
真题模拟 主讲:凌宇 时间:6月9日.
树立信心,沉着应战,吹响中考冲锋号 ——谈语文学科的复习备考及考试技巧.
请大家欣赏龙岩, 新罗区 上杭,武平, 连城,长汀, 永定,漳平 小吃和特产.
热爱党、热爱祖国、热爱人民 泉州九中初二年(10)班主题班会.
游 泳 理 论 课 位育中学 高蓉.
行政公文 纪 要 讲授人: 安学珍 铜仁职业技术学院.
二代健保補充保費 代扣項目說明 簡報.
1.某公司需购一台设备,有两个方案,假定公司要求的必要报酬率为10%,有关数据如下:
第4课 “千古一帝”秦始皇.
第一节 人口与人种 光山一中 屈应霞.
媽,我們真的不一樣 青少年期與中年期 老師: 趙品淳老師 組員: 胡珮玟4A1I0006 馬菀謙4A1I0040
第五章 二次型.
抚宁县第五中学 教学暨新课改推进工作会.
《社会体育指导员讲座》课程整体设计介绍 席永 副教授 2015 年 6 月
专项建设检查工作总结 本科试卷 毕业论文(设计) 合格课程 专项检查工作基本情况 专项建设的工作内容 专项建设检查工作情况
企业所得税几项热点难点 业务问题讲析 湛江市地税局税政科 钟胜强.
房地产开发企业 土地增值税清算 (基础篇).
班級老師:潘盈仁 班級:休閒三甲 學號:4A0B0124 學生:柯又瑄
告状 一位叫杨鲁的孩子,告他父亲杨庆的状。他极其认真地向父亲所在的工厂党委书记指控,说父亲不让儿子“游戏人间”,每天“画地为牢”,要儿子“咬文嚼字”,稍不满意,还要“入室操戈”。他声称父亲打他总是“重于泰山”,不象母亲打他“轻如鸿毛”。并且表示“庆父不死,鲁难不已”。
學校社工師服務與家訪技巧 三峽區駐區學校社工師 陳若喬.
2014年玉溪市统测质量分析 及高考语文应注意的几个问题
第三部分 区域可持续发展 第二单元 区域可持续发展 第7课 资源跨区域调配. 第三部分 区域可持续发展 第二单元 区域可持续发展 第7课 资源跨区域调配.
钢铁工业产能置换与相关政策 工业和信息化部产业政策司 辛 仁 周 二〇一五年三月二十八日.
中餐烹調丙級技術士考照 介紹 劉曉宜老師.
忆一忆 1.什么叫财政? 2.财政收入的形式有哪些? 国家的收入和支出。 税、利、债、费 3.其中,财政收入的最主要的形式是什么? 税收.
腐败的食物表面有白色小圆斑点,绿色斑点等
模块 中国古代史 主题 古代大一统(隋前).
遭遇险情有对策.
生物七下复习.
班級:二幼三甲 姓名:郭小瑄 、 詹淑評 學號:1A2I0029 、1A2I0025
第五单元 群星闪耀 复法指导 阅读与欣赏 单元重点 1.了解传记文的基本体例与特征。
經費結報注意事項 會 計 室 報告人:黃憶藍.
指導老師:陳韻如 姓名:吳宜珊 學號:4A0I0911 班級:幼保二乙
四种命题 班级:C274 指导教师:钟志勤 任课教师:颜小娟.
一、情境设置 思考: 下列语句的表述形式有什么特点? 你能判断它们的真假吗? (1)若直线a//b,则直线a和直线b无公共点;(2)2+4=7; (3)垂直于同一条直线的两个平面平行; (4)若x2=1,则x=1; (5)两个全等三角形的面积相等; (6)3能被2整除.
傳統童玩遊戲創新 組別:第八組 班級:幼保二甲 組員: 4A0I0005柯舒涵 4A0I0011謝孟真
目 錄 壹、緣由 貳、問題解析 參、問題歸納 肆、因應對策 伍、評鑑獎勵 陸、追蹤考核 1.
第五章 定积分及其应用.
量化研究與統計分析 比較平均數 Test 謝寶煖 台灣大學圖書資訊學系 2006年4月1日.
第 八 章 迴歸分析假設條件 之檢定及補救措施 2018/11/28.
高中语文复习 成语的运用 江西省泰和中学 曾剑红.
第8章 护理研究资料整理与分析 主讲教师:吴红艳.
第七章 假设检验 §7.1 假设检验的基本思想与概念 §7.2 正态总体参数假设检验 §7.3 其它分布参数的假设检验
第三章 假设检验 §3.1 假设检验的基本思想与概念 §3.2 正态总体的假设检验 §3.3 分布拟合检验.
统计软件应用 4 主讲人 陶育纯 SPSS统计分析 统计软件应用 4 主讲人 陶育纯 教案.
统计软件应用 4 主讲人 陶育纯 SPSS统计分析 统计软件应用 4 主讲人 陶育纯 教案.
函数与导数 临猗中学 陶建厂.
Presentation transcript:

理论联系实践 理论就是, 什么都懂,但什么都不会用 实践就是, 什么都不懂,却什么都会用 理论联系实践就是, 什么都不会用 而且还 什么都不懂

第六章 拟合优度检验 §6.1 卡方拟合优度检验 §6.2 列联表的独立性检验 §6.3 概率纸方法及正态性检验 §6.1 卡方拟合优度检验 §6.2 列联表的独立性检验 §6.3 概率纸方法及正态性检验 §6.4 Kolmogorov检验

§6.1 卡方拟合优度检验 6.1.1 分类数据的卡方拟合优度检验 我们先看一个在生物中很有名的例子。 §6.1 卡方拟合优度检验 6.1.1 分类数据的卡方拟合优度检验 我们先看一个在生物中很有名的例子。 在19世纪,Mendel按颜色与形状把豌豆分为四类:黄圆、青圆、黄皱和青皱。Mendel在他种的n=556个豌豆中,观测到这四类豌豆的个数分别为315,108,101,32.于是,Mendel判断这四类的比例为9:3:3:1.那Mendel的这种比例正确吗?

设总体X 可以分成k 类,记为 ,现对该总体作了n 次观测,k 个类出现的频数分别为: n1,…,nk, 且 检验如下假设: 其中诸 且

如果H0 成立,则对每一类Ai,其频率ni /n与概率pi 应较接近。即观测频数ni 与理论频数npi 应相差不大。据此,英国统计学家K 如果H0 成立,则对每一类Ai,其频率ni /n与概率pi 应较接近。即观测频数ni 与理论频数npi 应相差不大。据此,英国统计学家K.Pearson提出如下检验统计量: (6.2) 并证明在H0 成立时对充分大的n, (6.2) 给出的检验统计量近似服从自由度为k-1的 分布。 拒绝域为:

例6.1 为募集社会福利基金,某地方政府发 行福利彩票,中彩者用摇大转盘的方法确定 最后中奖金额。大转盘均分为20份,其中金 额为5万、10万、20万、30万、50万、100万 的分别占2份、4份、6份、4份、2份、2份。 假定大转盘是均匀的,则每一点朝下是等可 能的,于是摇出各个奖项的概率如下:

概率 0.1 0.2 0.3 额度 5万 10万 20万 30万 50万 100万 现20人参加摇奖,摇得5万、10万、20万、30万、50万和100万的人数分别为2、6、6、3、3、0,由于没有一个人摇到100万,于是有人怀疑大转盘是不均匀的,那么该怀疑是否成立呢?这就需要对转盘的均匀性作检验。

解:这是一个典型的分类数据卡方拟合优度检验,总体共有6类,其发生概率分别为0. 1、0. 2、0. 3、0. 2、0. 1和0 解:这是一个典型的分类数据卡方拟合优度检验,总体共有6类,其发生概率分别为0.1、0.2、0.3、0.2、0.1和0.1,这里k=6,检验拒绝域为: 若取 =0.05,则查表可知 由本例数据可以算出 =

由于 未落入拒绝域,故接受原假设, 没有理由认为转盘不均匀。 在分布拟合检验中使用p 值也是方便的。 本例中,以T 记服从 (5)的随机变量,则使用统计软件可以算出 这个p 值就反映了数据与假设的分布拟合程度的高低,p 值越大,拟合越好。

6.1.2 带有未知参数的卡方拟合优度检验 若诸 由r (r<k)个未知参数 确定,即 首先给出 的极大似然估计 6.1.2 带有未知参数的卡方拟合优度检验 若诸 由r (r<k)个未知参数 确定,即 首先给出 的极大似然估计 然后给出诸 的极大似然估计 Fisher证明了 在H0成立时近似服从自由度 为k-r-1的 分布,于是检验拒绝域为

例6.2 卢瑟福在2608个等时间间隔内观测一 枚放射性物质放射的粒子数X,表6.1是观测 结果的汇总,其中ni表示2608次观测中放射粒 子数为i的次数。 ni 57 203 383 525 532 408 273 139 45 27 10 6 i 0 1 2 3 4 5 6 7 8 9 10 11 试利用该组数据检验该放射物质在单位时间内放射出的粒子数是否服从泊松分布。

解:本例中,要检验总体是否服从泊松分布。 观测到 0, 1, …, 11 共 12 个不同取值,这相当于把总体分成12类。这里有一个未知参数 ,采用极大似然估计,  = 将 代入可以估计出诸 。 于是可计算出

列表如下。 1 2 3 4 5 6 7 8 9 10 11 57 203 383 525 532 408 273 139 45 27 0.0209 0.0807 0.1562 0.2015 0.1950 0.1509 0.0973 0.0538 0.0260 0.0112 0.0043 0.0022 54.5 210.5 407.4 525.5 508.6 393.5 253.8 140.3 67.8 29.2 11.2 5.7 0.1147 0.2672 1.4614 0.0005 1.0766 0.5343 1.4525 0.0120 7.6673 0.1658 0.1258 0.0158 合计 2608 1.0000 2068 =12.8967 i

若取 =0.05,则 本例中 =12.8967<18.307,故接受原假设。使用统计软件可以计算出此处检验的p 值是0.2295。

§6.2 列联表的独立性检验 列联表是将观测数据按两个或更多属性 (定性变量) 分类时所列出的频数表。例如,对随机抽取的1000人按性别(男或女)及色觉(正常或色盲) 两个属性分类,得到如下二维列联表,又称2×2表或四格表。

男 535 65 女 382 18 性别 视觉 正常 色盲

一般,若总体中的个体可按两个属性A与B分类,A 有r 个类 ,B 有c个类 从总体中抽取大小为n的样本,设其中有 个个体既属于 类又属于 类, 称为频数,将rc个 排列为一个r行c列的二维列联表,简称rc表(表6.3)。

表6.3二维列联表数据

列联表分析的基本问题是: 考察各属性之间有无关联,即判别两属性是否独立。如在前例中,问题是:一个人是否色盲与其性别是否有关?在rc表中,若以 和 分别表示总体中的个体仅属于 ,仅属于 和同时属于 与 的概率,可得一个二维离散分布表(表6.4),则“A、B两属性独立”的假设可以表述为

表6.4 二维离散分布表

这就变为上一小节中诸 不完全已知时的分布拟合检验。这里诸 共有rc个参数,在原假设H0成立时,这rc个参数 由r+c个参数 和 决定。在这r+c后个参数中存在两个约束条件:

在H0成立时,上式服从自由度为rc-(r+c-2)-1的 分布。 其中诸 是在H0成立下得到的 的极大似然估计,其表达式为 对给定的显著性水平 ,检验的拒绝域为:

例6.3 为研究儿童智力发展与营养的关系,某 研究机构调查了1436名儿童,得到如表6.5的 数据,试在显著性水平0.05下判断智力发展与 营养有无关系。 表6.5 儿童智力与营养的调查数据 营养良好 营养不良 合计 智 商 342 367 266 329 1304 56 40 20 132 16 423 382 286 345 1436 <80 8090 9099 100

解:用A表示营养状况,它有两个水平: 表示 营养良好, 表示营养不良;B表示儿童智商, 它有四个水平, 分别表示表中四种 情况。沿用前面的记号,首先建立假设 H0:营养状况与智商无关联,即A与B独立的。 统计表示如下: 在原假设H0成立下,我们可以计算诸参数的极大似然估计值:

进而可给出诸 ,如 其它结果见表6.6

表6.6 诸 的计算结果 由表6.5和表6.6可以计算检验统计量的值 营养良好 384.1677 346.8724 259.7631 表6.6 诸 的计算结果 营养良好 384.1677 346.8724 259.7631 313.3588 0.9081 0.2946 0.2660 0.1992 0.2403 营养不良 38.8779 35.1036 26.2881 31.7120 0.0919 <80 8090 9099 100 由表6.5和表6.6可以计算检验统计量的值

此处r=2,c=4,(r-1)(c-1)=3,若取 =0. 05 ,查表有 ,由于19. 2785>7 本例中检验的p 值为0.0002。

§6.3 正态性检验 正态分布是最常用的分布,用来判断总体分布是否为正态分布的检验方法称为正态性检验,它在实际问题中大量使用。 一、 正态概率纸 正态概率纸可用来作正态性检验,方法如下:利用样本数据在概率纸上描点,用目测方法看这些点是否在一条直线附近,若是的话,可以认为该数据来自正态总体,若明显不在一条直线附近,则认为该数据来自非正态总体。

例6.4 随机选取10个零件,测得其直径与标 准尺寸的偏差如下:(单位:丝) 9.4 8.8 9.6 10.2 10.1 7.2 11.1 8.2 8.6 9.6 在正态概率纸上作图步骤如下: (1) 首先将数据排序: 7.2 8.2 8.6 8.8 9.4 9.6 9.8 10.1 10.2 11.1; (2) 对每一个i,计算修正频率 (i-0.375)/(n+0.25), i=1,2,…,n,

(3) 将点 逐一点在正态概率纸上, (4) 观察上述n个点的分布: 若诸点在一条直线附近,则认为该批数 据来自正态总体; 若诸点明显不在一条直线附近,则认为 该批数据的总体不是正态分布。

从图6.2可以看到,10个点基本在一条直线附近,故可认为直径与标准尺寸的偏差服从正态分布。

如果从正态概率纸上确认总体是非正态分布时,可对原始数据进行变换后再在正态概率纸上描点,若变换后的点在正态概率纸上近似在一条直线附近,则可以认为变换后的数据来自正态分布,这样的变换称为正态性变换。常用的正态性变换有如下三个:对数变换 、倒数变换 和根号变换 。

例6.5 随机抽取某种电子元件10个,测得其寿 命数据如下: 110.47, 99.16, 97.04, 77.60, 4269.82, 539.35, 179.49, 782.93, 561.10, 286.80. 图6.3 给出这10个点在正态概率纸上的图形,这10个点明显不在一条直线附近,所以可以认为该电子元件的寿命的分布不是正态分布。

图6.3 例6.5 的正态概率纸

i 对该10个寿命数据作对数变换,结果见表6.8 表6.8 对数变换后的数据 1 32.62 3.4849 0.061 6 286.80 表6.8 对数变换后的数据 1 32.62 3.4849 0.061 6 286.80 5.6588 0.549 2 97.04 4.5752 0.159 7 539.35 6.2904 0.646 3 99.16 4.5967 0.256 8 561.10 6.3299 0.743 4 110.47 4.7048 0.354 9 782.93 6.6630 0.841 5 179.49 5.1901 0.451 10 2269.82 7.7275 0.939 i

利用表6. 8 中最后两列上的数据在正态概率纸上描点,结果见图6 利用表6.8 中最后两列上的数据在正态概率纸上描点,结果见图6.4,从图上可以看到10个点近似在一条直线附近,说明对数变换后的数据可以看成来自正态分布。这也意味着,原始数据服从对数正态分布

图6.4 变换后数据的正态概率纸

二、夏皮洛-威尔克(Shapiro-Wilk)检验 夏皮洛-威尔克检验也简称W 检验。这个检验当8n50时可以利用。过小样本(n<8)对偏离正态分布的检验不太有效。 W 检验是建立在次序统计量的基础上。 检验统计量为: (6.5) 其中系数ai 可查附表。

拒绝域为: {WW}。 其中 分位数 可查附表. 系数 还具有如下几条性质:

据此可将(6.5)简化为

例6.6 某气象站收集了44个独立的年降雨量数 据,资料如下(已排序): 520 556 561 616 635 669 686 692 704 707 711 713 714 719 727 735 740 744 745 750 776 777 786 791 794 821 822 826 834 837 851 862 873 879 889 900 904 922 926 952 963 1056 1074 我们要根据这批数据作正态性检验。

首先由这批数据可算得: 我们将计算W 的过程列于表6.9中。 为便于计算,值 , 和 安排在同一行。

表6.9 某一气象站收集的年降雨量 1 520 1074 554 0.3872 2 556 1056 500 0.2667 3 561 963 402 0.2323 4 616 952 336 0.2072 5 635 926 291 0.1868 6 669 922 253 0.1695 7 686 904 218 0.1542 k

k 8 692 900 208 0.1405 9 704 889 185 0.1278 10 707 879 172 0.1160 11 711 873 162 0.1049 12 713 862 149 0.0943 13 714 851 137 0.0842 14 719 837 118 0.0745 15 727 834 107 0.0651

k 16 735 826 91 0.0560 17 740 822 82 0.0471 18 744 821 77 0.0383 19 745 794 49 0.0296 20 750 791 41 0.0211 21 776 786 10 0.0126 22 777 9 0.0042

从表6.9可以计算出W 的值: 若取 =0.05,经查表可知,在n=44时有: 由于计算得到的W 值大于该值,所以在显著性水平 =0.05上不拒绝零假设,即可以认为该批数据服从正态分布。

§6.4 Kolmogorov-Smirnov检验 这是检验单一样本是否来自某一特定分布的方法。比如检验一组数据是否为正态分布。 它的检验方法是以样本数据的累计频数分布与特定理论频数比较,若两者间的差距很小,则推论该样本取自某特定分布。 即考虑假设检验问题: H0 :样本所来自的总体分布服从某特定分布 H1 :样本所来自的总体分布不服从某特定分布

例如,收集一批周岁儿童身高的数据,需利用样本数据推断周岁儿童总体的身高是否服从正态分布。 再例如,利用收集的住房状况调查的样本数据,分析家庭人均住房面积是否服从正态分布。 这里我们仅以Kolmogorov-Smirnov正态性检验为例介绍它的统计原理。

F0(x)表示给定分布的分布函数, Fn(x) 表示一组随机样本的经验分布函数。设D为F0(x)与Fn(x)差距的最大值,定义如下式: D =sup| Fn(x) - F0(x) | 结论:当实际观测D ≥ c时,则拒绝H0 ,反之则不拒绝H0假设。 c 值可通过查表得到。

例:35位健康男性在未进食前的血糖浓度如下所示,试检验这组数据是否来自均值μ=80,标准差σ=6的正态分布. 87 77 92 68 80 78 84 77 81 80 80 77 92 86 76 80 81 75 77 72 81 72 84 86 80 68 77 87 76 77 78 92 75 80 78 假设 H0 :健康成人男性血糖浓度服从N(80,62) H1 :健康成人男性血糖浓度不服从N(80,62) 计算过程如表:

结论:上表中的理论值F0(x)是根据标准化值z查表得到,实际上 D =sup| Fn(x) - F0(x) |=0.1754<D0.05, 35=0.23 (查D值表可得D0.05, 35=0.23) 故不能拒绝H0即健康成年男人血糖浓度服从正态分布.

适用范围:单样本 K-S 检验可以将一个变量的实际频数分布与高斯分布(Gaussian)、均匀分布(Uniform)、泊松分布(Poisson)、指数分布(Exponential)等进行比较。

卡方检验与Kolmogorov-Smirnov正态性检验都采用实际频数和期望频数进行检验。它们之间最大的区别在于前者主要用于分类数据,而后者主要用于有单位的定量数据,有时前者也可以用于定量数据但必须将数据分组得到实际观测频数,并要求多变量之间独立,而后者可以不分组直接把原始数据进行检验,因此K-S检验对数据的应用较完整。