第七章 样本分布 数理统计是研究如何有效地收集、整理和分析带有随机影响的数据,从而对所观察的现象做出推断或预测,为决策提供依据的一门学科。

Slides:



Advertisements
Similar presentations
简单迭代法的概念与结论 简单迭代法又称逐次迭代法,基本思想是构造不动点 方程,以求得近似根。即由方程 f(x)=0 变换为 x=  (x), 然后建立迭代格式, 返回下一页 则称迭代格式 收敛, 否则称为发散 上一页.
Advertisements

南 通. 南通概述 南通,位于江苏省东部, 东抵黄海,南望长江。 “ 据江 海之会、扼南北之喉 ” ,隔江 与中国经济最发达的上海及 苏南地区相依,被誉为 “ 北上 海 ” 。 南通也是中国首批对 外开放的 14 个沿海城市之一 ,被称为 “ 中国近代第一城 ” 。 南通面临海外和内陆两大经 济辐射扇面,素有.
1 天天 5 蔬果 國立彰化特殊教育學校 延杰股份有限公司營養師:陳婷貽. 2 蔬果彩虹 579 蔬果彩虹 歲以內兒童,每天 攝取五份新鮮蔬菜水 果,其中應有三份蔬 菜兩份水果 蔬菜份數水果份數總份數 兒童 325 女性 437 男性 549.
病历书写 中山医院呼吸科 张 新. 定 义 病历是临床医生根据问诊、体格检查、实验 室和其他检查获得的资料经过归纳、分析、整理, 按照规定的格式而写成的;是关于病人发病情况, 病情发展变化,转归和诊疗情况的系统记录。 病历是临床医生根据问诊、体格检查、实验 室和其他检查获得的资料经过归纳、分析、整理,
高等学校英语应用能力考试 考务培训 兰州文理学院教务处 2014 年 12 月. 考务培训 21 日请监考人员上午 8:00 (下午 2:30 )到综合楼 205 教室集合,查看 监考安排,由考务负责人进行考务 培训。
第十二章 病历书写与要求 病历病历 医务人员在医疗中形成的文字、符号、图表、 影像、切片等资料的总和。 病历书写 通过诊法、诊断、治疗、护理等医疗活动获得有关资 料,进行归纳、分析、整理形成医疗活动记录行为。 病历意义 A 诊疗等的源文件; B 复 / 转 / 会诊,解决医疗纠纷、判定法律责任、医疗保险等的资料和依据;
語言與文化通識報告 - 台日年菜差異 - 指導老師 : 葉蓁蓁 小組 : 日本微旅行 組員 :4a21b032 吳采玲 4a21b037 沈立揚 4a 洪雅芳 4a 陳楚貽 4a 王巧稜.
均衡推进,确保质量 08学年第一学期教学工作会议 广州市培正中学
如何备考 2014’ 省考 华图教育 1.
黑木耳.
投資權證13問 交易所宣導資料(104) 1.以大盤指數為標的之權證,和大盤指數的連動性,為什麼比和期交所期指的連動性差?
如何把作文写具体.
第一章 人口与环境 第一节 人口增长模式.
第一节 人口与人种 第一课时.
解读我党发展史 思索安惠美好明天 主讲人:王辰武.
现代文部分教材分析及写作 八年级语文(上)
专利技术交底书的撰写方法 ——公司知识产权讲座
第5课 长江和黄河.
銓敘部研究規劃自願退休公務人員月退休金起支年齡延後方案座談會
瓦罐湯 “瓦缸煨汤”是流行于南方民间的一种风味菜肴。它采用一种制特的大瓦缸,其缸底可以烧火,缸内置有铁架,厨师将装有汤的小瓦罐一层层地码入缸内的铁架上,然后点燃木炭,借用木炭火产生的高温将瓦罐内的汤煨熟。
1.數學的難題 如下圖所示,你知道表格中的問號應填入什麼數字嗎?
这是一个数字的 乐园 这里埋藏着丰富的 宝藏 请跟我一起走进数学的 殿堂.
第九章 欧氏空间 §1 定义与基本性质 §2 标准正交基 §3 同构 §4 正交变换 §5 子空间 §6 对称矩阵的标准形
第九章 欧氏空间 §1 定义与基本性质 §6 对称矩阵的标准形 §2 标准正交基 §7 向量到子空间的 距离─最小二乘法 §3 同构
合肥学院外国语言系2012年度 学生工作表彰大会.
105年基北區高中職適性入學宣導 教育會考後相關作業說明
真题模拟 主讲:凌宇 时间:6月9日.
树立信心,沉着应战,吹响中考冲锋号 ——谈语文学科的复习备考及考试技巧.
请大家欣赏龙岩, 新罗区 上杭,武平, 连城,长汀, 永定,漳平 小吃和特产.
新材料作文.
游 泳 理 论 课 位育中学 高蓉.
行政公文 纪 要 讲授人: 安学珍 铜仁职业技术学院.
二代健保補充保費 代扣項目說明 簡報.
1.某公司需购一台设备,有两个方案,假定公司要求的必要报酬率为10%,有关数据如下:
第4课 “千古一帝”秦始皇.
一、平面点集 定义: x、y ---自变量,u ---因变量. 点集 E ---定义域, --- 值域.
企业所得税几项热点难点 业务问题讲析 湛江市地税局税政科 钟胜强.
挖掘市场预期分布 建立有效投资策略 权证市场2006年中期投资策略
请说出牛顿第一定律的内容。.
房地产开发企业 土地增值税清算 (基础篇).
第二学习主题 第7课 辛亥革命 辛亥革命的酝酿 武昌起义 辛亥革命的历史意义 课堂小结.
数列(一) 自强不息和谐发展 授课教师:喻永明.
植物的繁殖方式与育种 第2章.
管理学基本知识.
台灣的名勝古蹟.
滁州学院首届微课程教学设计竞赛 课程名称:高等数学 主讲人:胡贝贝 数学与金融学院.
第三章 生产费用的核算 第一节 材料费用的归集和分配 第二节 工资费用的归集和分配 第三节 辅助生产费用的归集和分配
触电预防与急救 杜芳艳.
四种命题 班级:C274 指导教师:钟志勤 任课教师:颜小娟.
1.1.2 四 种 命 题.
一、情境设置 思考: 下列语句的表述形式有什么特点? 你能判断它们的真假吗? (1)若直线a//b,则直线a和直线b无公共点;(2)2+4=7; (3)垂直于同一条直线的两个平面平行; (4)若x2=1,则x=1; (5)两个全等三角形的面积相等; (6)3能被2整除.
第三节 细胞外被与细胞外基质 1、胶原 细胞外被(糖萼)指细胞外覆盖的一层粘多糖(糖蛋白或糖脂)
台灣史總複習.
【鲁人版六年级下册第十课】 在生活中磨炼自己 特殊字体:李旭科毛笔行书 【招远市魁星路中学 刘刚治】 1.
第五章 定积分及其应用.
拾貳、 教育行政 一、教育行政的意義 教育行政,可視為國家對教育事務的管理 ,以增進教育效果。 教育行政,乃是一利用有限資源在教育參
课标教材下教研工作的 实践与思考 山东临沂市教育科学研究中心 郭允远.
國文報告 儒家生死文化討論 不死鳥 組員 972BP001 彭科強 972BP008 王薪榕 972BP025 彭裕宗
課程銜接 九年一貫暫行綱要( )  九年一貫課程綱要( ) 國立台南大學數學教育系 謝 堅.
第八章二元一次方程组 8.3实际问题与二元一次方程组.
第八章二元一次方程组 8.3实际问题与二元一次方程组 (第3课时).
2.4 二元一次方程组的应用(1).
105年基北區高中職適性入學宣導 教育會考後相關作業說明
物理学专业 光学实验绪论 主讲人:路莹 洛阳师范学院物理与电子信息学院 2009年3月.
高雄半日遊 西子灣-旗津-駁二.
河北省昌黎县第三中学李晓荣.
歡迎大家來到開心國小! 我們每個月舉辦一次慶生會, 所以現在要調查全班的生日。 1號: 9/19 9號: 3/17 2號: 9/5 10號: 5/12 3號: 1/8 11號: 7/25 4號:11/27 12號:10/4 5號: 8/31 13號: 9/5 6號:
小學常識六年級 知 識 產 權 知 多 少 樊佩芳老師.
用加減消去法解一元二次聯立方程式 台北縣立中山國中 第二團隊.
函数与导数 临猗中学 陶建厂.
Presentation transcript:

第七章 样本分布 数理统计是研究如何有效地收集、整理和分析带有随机影响的数据,从而对所观察的现象做出推断或预测,为决策提供依据的一门学科。 第七章 样本分布 数理统计是研究如何有效地收集、整理和分析带有随机影响的数据,从而对所观察的现象做出推断或预测,为决策提供依据的一门学科。 在近一个多世纪的发展中,数理统计不同程度地渗透到人类活动的许多领域。人口调查、税收预算、测量误差、出生与死亡统计、保险业中赔款额和保险金的确定等,这些数理统计早期主要研究的问题,直到现在仍然值得认真研究。在近半个世纪以来,数理统计在理论、方法、应用上都有较大的发展。抽样调查、试验设计、回归分析与回归诊断、多元分析、时间序列分析、非参数统计、统计决策函数、统计计算、随机模拟、探索性数据分析等统计方法相继产生并在实践中普遍使用,把以描述为主的统计发展到以推断为主的统计。数理统计的内容已异常丰富,应用广泛,成为当前最活跃的学科之一。

§7.1 总体与样本 一、   总体与个体 总体指研究对象的某项数量指标值的全体。组成总体的每个元素称为个体。由于每个个体的出现带有随机性,即相应的数量指标值的出现带有随机性。从而可把此种数量指标看作随机变量,我们用一个随机变量及其分布来描述总体。为此常用随机变量的符号或分布的符号X,Y,Z…,F(x) …来表示总体。 例7.1研究某灯泡的使用寿命时,总体可用随机变量X来表示,或用其分布函数F(x)表示。

例7.2研究某地区学龄前儿童发育情况,人们关心的是其体重X和身高Y这两个数量指标,则此总体就可用二维随机变量(X,Y)或其联合分布函数F(x,y)表示. 二、样本 为了推断总体分布及其各种特征,就必须从总体中按一定法则抽取若干个体进行观测或试验,以获得有关总体的信息.这一抽取过程称为抽样.所抽取的部分个体称为样本,样本中个体的数目称为样本容量.例如容量为n的样本可以看作是n维随机变量( ), 其观察值为( ).

简单随机抽样 它要求满足两点: (1)代表性. 样本中每个个体与所考虑的总体有相同的分布.即样本中每个个体与总体X具有相同的分布. (2)独立性. 样本中每个个体取什么值并不影响其它个体取什么值.即必须是相互独立的随机变量. 由简单随机抽样所得到的样本称为简单随机样本.假如总体的分布函数为F(x),则其简单随机样本的联合分布函数为

三、分布族 在概率论研究中,随机变量的分布总是假设给定的,但在数理统计的研究中,总体的分布是未知的,但总可以假定总体的分布是某一个分布族的成员. 例7.3 在研究某批灯泡的质量时,若关心的是其质量是否合格,若合格记为0,不合格记为1,因此该总体就可用仅取0和1的随机变量X来表示.显然,这个总体的分布就是一个参数为p的二点分布b(1,p),由于p未知,故这个总体分布也是未知的,但可以假定该总体分布是二点分布族 F={b(1,p);0<p<1}

若人们关心的是灯泡的寿命。这是一个无限总体。假如人们根据过去的资料知道灯泡的寿命X服从指数分布,其密度函数为 所需确定的参数是λ>0.

四、从样本去认识总体 ⑴ 频数频率分布表及其图示 ⑴ 频数频率分布表及其图示 例7.4 我们通常饮用的矿泉水有19个指标.某市技术监督局一次抽查了58批矿泉水,记录每一批矿泉水的每个指标是否合格,从中可统计出每批矿泉水不合格指标的个数X.这里X是一个离散型随机变量,其一切可能取值为0,1,…19。 58批矿泉水的指标不合格数构成了一个容量为58的样本的观察值,每个可取0,1,…,19中某个值,将它们整理后列成表1.1.1

表 1 58批矿泉水不合格指标数的频率、 频数分布表 表 1 58批矿泉水不合格指标数的频率、 频数分布表

(2) 经验分布函数 样本直方图可以形象地去描述总体概率密度函数大致形状,经验分布函数将可以用来描述总体分布函数的大致形状. (2)       经验分布函数 样本直方图可以形象地去描述总体概率密度函数大致形状,经验分布函数将可以用来描述总体分布函数的大致形状. 定义1.1.1 设总体X的分布函数为F(x),从中获得的样本观察值为 ,将它们从小到大排列成 ,令 经验分布函数是一个等概率仅取n个值的离散型随机变量的分布函数 称 为该样本的经验分布函数.

例7.5 写出经验分布函数 某食品厂用自动装罐机生产净重量为345克的午餐肉罐头,由于随机性,每个罐头的净重有差别,现从中随机取10个罐头,其净重如下: 344,336,345,342,340, 338,344,343,344,343, 求经验分布函数.

统计量及其分布 1.定义1.2.1 设 是取自某总体的一个容量为n的样本,假如样本函数 中不含任何未知参数,则称T为统计量.统计量的分布称为抽样分布. 2.常用的几个统计量 设 是来自总体X的样本 ⑴样本均值 样本均值是反映总体数学期望所在位置信息的一个统计量,是总体数学期望的一个很好的估计.

⑵样本方差 样本标准差 样本方差与样本标准差反映了数据取值分散与集中的程度,即反映了总体方差与标准差的信息. ⑶样本k阶(原点)矩 样本k阶中心矩 它们分别反映了总体k阶(原点)矩与k阶中心矩的信息.

⑷样本偏度 SK反映了总体分布密度曲线的对称性信息. 当SK>0时,分布的形状是右尾长,称为正偏的;当SK<0时,分布的形状是左尾长,称为负偏的. ⑸样本峰度 KU反映了总体分布密度曲线在其峰值附近的陡峭程度的信息,当KU>0时,分布密度曲线在其峰比正态分布来得陡;当KU<0时,比正态分布来得平坦.

⑹次序统计量 被称为样本的第i个次序统计量,它是样本 的满足如下条件的函数: 每当样本得到一组观察值( )时,将它们从小到大排列为 ,第i个值 便是 的观察值, 称为该样本的次序统计量. 又 称为该样本的最小次序统计量, 称为该样本的最大次序统计量.

⑺样本极差 若样本容量为n,则样本极差 它反映了样本取值范围的大小,也反映了总体取值分散与集中的程度. 极差常在小样本(n≤30)场合使用,而在大样本场合很少在实际中使用. 这是因为极差仅使用了样本中两个极端点的信息,而把中间的信息都丢弃了,当样本容量越大时,丢弃的信息也就越多,从而留下的信息过少,其使用价值就不大了.

(8) 样本 p 分位数和中位数 定义 设 是来自总体 F(x) 样本, 为该样本的次序统计量. 对于 , 称 对于 , 称 为该样本的 p 分位数(或 p 分位点). 称为样本中位数, 显然有

第一四分位数 第三四分位数

例2 设 是 F(x) 的样本, 分别为总体均值与方差, 从中任选两个分量 和 令 有 此种统计量有 个,加起来平均得:

几种常用的分布族 ⑴ 分布 Ⅰ定义:1.2.2 设 为相互独立的随机变量,且均服从标准正态分布N(0,1),则称随机变量 ⑴ 分布 Ⅰ定义:1.2.2 设 为相互独立的随机变量,且均服从标准正态分布N(0,1),则称随机变量 服从自由度为n的 分布,记作 自由度可理解为平方和中独立变量的个数. Ⅱ 分布性质 (1)设 , 则E(X)=n,D(X)=2n. (2) 可加性:设 , ,且X与Y独立,则

下图描绘了 分布密度函数在n=5,10,20时的图形.

(2) t分布 ①定义1.2.3:设X~N(0,1), ,且X与Y独立,则称随机变量 所服从的分布为t分布,记为T~t(n),称n为自由度.

(3)F分布 ①定义1.2.4:设 , , 且X与Y独立,则称随机变量 服从自由度为(n,m)的F分布,记作 . ①定义1.2.4:设 , , 且X与Y独立,则称随机变量 服从自由度为(n,m)的F分布,记作 . 图1.2.4描绘了 的密度函数曲线

(4)Γ分布族 定义1.2.5:定义在正实数上,且用密度函数 表示的概率分布称为Γ分布,记为Γ(α,λ).其中α>0是形状参数,λ>0是尺度参数.而{Γ(α,λ);α>0,λ>0}就是Γ分布族 当α=1时的Γ分布为指数分布其密度曲线如下:

Γ分布族性质

(5)β分布族 定义1.2.6:定义在[0,1]上,且密度函数 表示的概率分布称为β分布记为β(a,b),其中a>0,b>0.而{β(a,b): a>0,b>0}为β分布族. β分布有几个重要的特例.当a=1,b=1时, β分布就是U(0,1)

随机变量的分布的分位点 1、设随机变量X~F(x),给定常数:0<<1, 若存在 , 满足 , 若存在 , 满足 , 则称 为分布F(x)的上(侧)分位点. 2、设随机变量X~N(0,1) , 给定常数:0<<1, 若存在 , 满足 , 则称 为标准正态分布的上侧分位点.

标准正态分布的分位点 0.001 0.005 0.01 0.025 0.05 0.10 3.090 2.576 2.327 1.96 1.645 1.282

分布分位点 设X ~ 2(n),若对于:0<<1, 满足 则称 为 分布的上分位点。

t分布分位点 设T~t(n),若对:0<<1,存在t(n) , 满足P{T>t(n)}= , 则称t(n)为t(n)的上侧分位点.

F—分布的分位点 设F~ F(n1, n2) 对于 :0<<1,若存在F(n1, n2),满足 P{F>F(n1, n2)}= , 则称F(n1, n2)为F(n1, n2)的上侧分位点

正态总体的抽样分布定理 (1)证明: 是n 个独立的正态随机变量的线性组合,故服从正态分布

(3)证明: 且U与 独立,根据t分布的构造