第一节 数理统计的基本概念
数理统计学是一门应用性很强的学科. 它是研究怎样以有效的方式收集、 整理和分析带有随机性的数据,以便对所考察的问题作出推断和预测. 由于大量随机现象必然呈现它规 律性,只要对随机现象进行足够多次 观察,被研究的规律性一定能清楚地 呈现出来. 客观上, 只允许我们对随机现象 进行次数不多的观察试验 ,我们只 能获得局部观察资料.
数理统计的任务就是研究有效地收集、整理、分析所获得的有限的资料,对所研究的问题, 尽可能地作出精确而可靠的结论. 在数理统计中,不是对所研究的对象全体 ( 称为总体)进行观察,而是抽取其中的部分(称为样本)进行观察获得数据(抽样),并通过这些数据对总体进行推断. 数理统计方法具有“部分推断整体”的 特征 .
在数理统计研究中,人们往往研究有关对象的某一项(或几项)数量指标,对这一指标进行随机试验,观察试验结果全部观察值,从而考察该数量指标的分布情况.这时,该数量指标的全体就是总体.每个数量指标就是个体. 某批 灯泡的寿命 该批灯泡寿命的全体就是总体 国产轿车每公里 的耗油量 国产轿车每公里耗油量的全体就是总体
总体 一个统计问题总有它明确的研究对象. 一、总体和样本 1.总体 研究对象的全体称为总体, 总体中每个成员称为个体, 总体中所包含的个体的个数称为总体的容量. … 研究某批灯泡的质量 总体 有限总体 总体 无限总体
总体就可以用一个随机变量及其分布来描述. 我们关心的是总体中的个体的某项指标(如人的身高、灯泡的寿命,汽车的耗油量…) . 由于每个个体的出现是随机的,所以相应的数量指标的出现也带有随机性 . 从而可以把这种数量指标看作一个随机变量X ,因此随机变量X的分布就是该数量指标在总体中的分布. 总体就可以用一个随机变量及其分布来描述. 因此在理论上可以把总体与概率分布等同起来.
总体 寿命 X 可用一概率 例如:研究某批灯泡的寿命时,关心的数量指标就是寿命,那么,此总体就可以用随机变量X表示。 (指数)分布来刻划 鉴于此,常用随机变量的记号 表示总体. 如总体X.
类似地,在研究某地区中学生的营养状况时 ,若关心的数量指标是身高和体重,我们用X 和Y 分别表示身高和体重,那么此总体就可用二维随机变量(X,Y) 来表示. 统计中,总体这个概念 的要旨是:总体就是一个概 率分布.
2. 样本 总体分布一般是未知,或只知道是包含未知 参数的分布,为推断总体分布及各种特征,按一定规则从总体中抽取若干个体进行观察试验,以获得有关总体的信息 ,这一抽取过程称为 “抽样”,所抽取的部分个体称为样本. 样本中所包含的个体数目称为样本容量. 从国产轿车中抽5辆进行耗油量试验 样本容量为5 抽到哪5辆是随机的
一旦取定一组样本X1,… ,Xn ,得到n个具体的数 (x1,x2,…,xn),称为样本的一次观察值,简称样本值 .
最常用的一种抽样叫作“简单随机抽样”,其特点: 1. 代表性: X1,X2,…,Xn中每一个与所考察的总体有 相同的分布. 2. 独立性: X1,X2,…,Xn是相互独立的随机变量. 由简单随机抽样得到的样本称为简单随机样本,它可以用与总体独立同分布的n个相互独立的随机变量X1,X2,…,Xn表示.
简单随机样本是应用中最常见的情形,今后,当说到“X1,X2,…,Xn是取自某总体的样本”时,若不特别说明,就指简单随机样本. 若总体的分布函数为F(x)、概率密度函数为f(x),则其简单随机样本的联合分布函数为 =F(x1) F(x2) … F(xn) 其简单随机样本的联合概率密度函数为 =f(x1) f(x2) … f(xn) 简单随机样本是应用中最常见的情形,今后,当说到“X1,X2,…,Xn是取自某总体的样本”时,若不特别说明,就指简单随机样本.
3. 总体、样本、样本值的关系 事实上我们抽样后得到的资料都是具体的、确定的值. 如我们从某班大学生中抽取10人测量身高,得到10个数,它们是样本取到的值而不是样本. 我们只能观察到随机变量取的值而见不到随机变量.
总体(理论分布) ? 样本 样本值 统计是从手中已有的资料——样本值,去推断总体的情况——总体分布F(x)的性质. 样本是联系二者的桥梁 总体分布决定了样本取值的概率规律,也就是样本取到样本值的规律,因而可以由样本值去推断总体.
第二节 统计量
1. 统计量的概念 由样本值去推断总体情况,需要对样本值进行“加工”,这就要构造一些样本的函数,它把样本中所含的(某一方面)的信息集中起来. 这种不含任何未知参数的样本的函数称为统计量. 它是完全由样本决定的量.
定义
样本均值 样本方差 样本(未修正)方差 样本标准差 2.常用统计量 它反映了 总体均值的信息 样本均值 样本方差 它反映了总体 方差的信息 样本(未修正)方差 样本标准差
样本k阶原点矩 k=1,2,… 样本k阶中心矩 k=1,2,… 阶矩的信息 k=1,2,… 样本k阶中心矩 它反映了总体k 阶 中心矩的信息 k=1,2,…
第三节 抽样分布
一、正态分布 定理1
标准正态分布的双侧 分位数 设 若数 满足条件 则称 为标准正态分布的 双侧分位数。
服从正态分布的样本函数 定理 2 (样本均值的分布) 设 X1, X2, …, Xn 是来自正态总体 的样本, 是样本均值,则有
请注意 : n取不同值时样本 均值 的分布
定理3
分布 二、 分布是由正态分布派生出来的一种分布. 定义: 设 相互独立, 都服从正态分布 N(0,1), 则称随机变量: 所服从的分布为自由度为 n 的 分布. 记为
分布的密度函数为 其中伽玛函数 通过积分 来定义. 性质.设 且X1,X2相互独立, 这个性质叫 分布的可加性.
服从 分布的样本函数 (定理6) 设X1,X2,…,Xn是来自正态总体 的样本, 分别为样本均值和样本方差, 则有 n取不同值时 的分布
三、t 分布 所服从的分布为自由度为 n的 t 分布. 概率密度函数为: 定义: 设X~N(0,1) , Y~ , 且X与Y相互 独立,则称变量 所服从的分布为自由度为 n的 t 分布. 概率密度函数为:
服从t分布的样本函数 (定理8) 设X1,X2,…,Xn是取自正态总体 的样本, 分别为样本均值和样本方差, 则有
定理 9 (两总体样本均值差的分布) 分别是这两个样本的 且X与Y独立, X1,X2,…, 是来自X的样本, 是取自Y的样本, 这两个样本的样本方差,则有 Y1,Y2,…, 样本均值, 分别是
服从自由度为n1及 n2 的F分布,n1称为第一自由度,n2称为第二自由度,记作 定义: 设 U 与V 相互独立,则称随机变量 服从自由度为n1及 n2 的F分布,n1称为第一自由度,n2称为第二自由度,记作 F~F(n1,n2) . 由定义可见, ~F(n2,n1)
F分布的上侧分位数
定理 12 (两总体样本方差比的分布) 分别是这两个样本的 且X与Y独立, X1,X2,…, 是来自X的样本, 是取自Y的样本, 这两个样本的样本方差,则有 Y1,Y2,…, 样本均值, 分别是
四、例题 解
五、小结 在这一节中我们学习了统计量的概念 , 几个重要的统计量及其分布 ,即抽样分布. 要求大家熟练地掌握它们 .
常用的统计量 样本平均值 样本方差 样本标准差 样本k阶原点矩 样本k阶中心矩
抽样分布 t 分布 F分布
抽样分布定理 样本均值的分布 样本方差、均值的分布
两总体样本均值差、样本方差比的分布
数理统计的基本概念(6学时,第六章) 1.理解总体、简单随机样本和统计量的概念。掌握 频率直方图的作法,掌握样本均值和样本方差的计算。 2.了解 分布、t分布、F分布的定义,知道 分布、 t分布、F分布的性质,了解分位数的概念并会查表计算。 3.了解正态总体的某些常用抽样分布。