数理统计基本知识
随机变量及其概率分布全面描述了随机现象的统计 性规律。概率论的许多问题中,随机变量的概率分布通常 是已知的,或者假设是已知的,而一切计算与推理都是在 这个基础上得出来的。 但实际中,情况往往并非如此,随机变量所服从的分布可能是完全不知道的,或者知道其分布概型,但是其中的某些参数是未知的。 某公路上行驶车辆的速度服从什么分布是未知的; 电视机的使用寿命服从什么分布是未知的; 产品是否合格服从两点分布,但参数——合格率p未知;
数理统计学是一门关于数据收集、整理、分析和推断的 科学。 数理统计的任务则是以概率论为基础,根据试验所得到 的数据,对研究对象的客观统计规律性做出合理的推断。 以样本的信息来推断总体的信息,是数理统计学研究的 重要问题。
总体 研究对象的全体称为总体。组成总体的每个研究对象 称为个体。 抽样 要了解总体的分布规律,在统计分析工作中,往往需 从总体中抽取一部分个体进行观测,这个过程称为抽样。
样本 在抽取过程中,每抽取一个个体,就是对总体X 进行一次随机试验,每次抽取的n个个体 称为总体X的一个样本。 样本中所包含的个体数量称为样本容量。 样本 是n个随机变量,抽取之后 的观测数据 称为样本观察值或样本值。
随机抽样方法的基本要求 代表性——即样本( )的每个分量 与总体 具有相同的概率分布。 独立性——即每次抽样的结果既不影响其余各次抽样的 代表性——即样本( )的每个分量 与总体 具有相同的概率分布。 独立性——即每次抽样的结果既不影响其余各次抽样的 结果,也不受其它各次抽样结果的影响。 满足上述两点要求的样本称为简单随机样本. 获得简单随机样本的抽样方法叫简单随机抽样.
简单随机抽样 例如:要通过随机抽样了解一批产品的次品率, 如果每次抽取一件产品观测后放回原来的总量中,则 这是一个简单随机抽样。 但实际抽样中,往往是不再放回产品,则这不是一个简单随机抽样。但当总量N很大时,可近似看成是简单随机抽样。
设总体X具有分布函数F(x), X1, X2, …, Xn 为 取自该总体的样本,则样本联合分布函数为 则样本的联合密度函数为 对于离散型总体X,设其概率函数为P(X=x) =p(x), 则样本的联合概率函数为
统计量 完全由样本决定的量称为统计量,它只依赖于样本,不依赖于任何未知参数. 例如: 设 是从正态总体 中抽取 例如: 设 是从正态总体 中抽取 的一个样本,其中 为已知参数, 为未知参数, 则 是统计量 不是统计量
几个常用的统计量 设 是总体 的一个样本, 样本均值 样本方差 样本均方差或样本标准差
设 是总体 的一个样本, 样本的K阶原点矩 样本的K阶中心矩 样本的2阶中心矩
X(i) 称为该样本的第i 个顺序统计量,它的取值 是将样本观测值由小到大排列后得到的第 i 个 设 X1, X2, …, Xn 是取自总体X的样本, X(i) 称为该样本的第i 个顺序统计量,它的取值 是将样本观测值由小到大排列后得到的第 i 个 观测值。其中X(1)=minX1, X2,…, Xn称为该样本 的最小顺序统计量,称 X(n)=maxX1,X2,…,Xn为 该样本的最大顺序统计量。称R= x(n) -x(1)为极差 样本中位数
设 X1,X, …, Xn 是取自总体分布函数为F(x)的样本,若将样本观测值由小到大进行排列,为 x(1), x(2), …, x(n),则称 x(1), x(2), …, x(n) 为有序样本, 用有序样本定义如下函数 则Fn(x)是一非减右连续函数,且满足 Fn() = 0 和 Fn() = 1 则Fn(x)是一个分布函数,称Fn(x)为经验分布函数。
例 某食品厂生产听装饮料,现从生产线上 随机抽取5听饮料,称得其净重(单位:克) 351 347 355 344 351 这是一个容量为5的样本,经排序可得有序样本: x(1)= 344, x(2)= 347, x(3)= 351, x(4)= 354, x(5)= 355 其经验分布函数为
格里纹科定理 设X1,X2,…,Xn是取自总体分布函数为F(x)的样本, Fn(x) 是其经验分布函数。则对任意>0,当n时,有 PFn(x) F(x) = 1 当n 相当大时,经验分布函数是总体分布函数F(x)的一个良好的近似。经典的统计学中一切统计推断都以样本为依据,其理由就在于此。
三大统计分布
c2分布 设(X1,X2,…,Xn)相互独立, 且都服从标准正态分布N (0,1),则称 服从自由度为n的c2分布, 记为
Xi~N( , 2)且X1,X2,…,Xn相互独立,则 性质 设(X1,X2,…,Xn)为取自正态总体X~N( , 2) 的样本,则 证明 Xi~N( , 2)且X1,X2,…,Xn相互独立,则 且各 相互独立,
例 设总体 为总体X 的样本, 试确定常数 c , 使 cY 服从 分布. 解
2分布的数学期望与方差 设X~ 2(n),则E(X)=n,D(X)=2n. 2分布的可加性 设 且X与Y相互独立, 则
分位数 x o y x 对X和给定的 (0<<1),若存在x, 则称x为X的分布的上侧分位数 使P{X≥x} =, 对X和给定的 (0<<1),若存在x, 则称x为X的分布的上侧分位数 x o y x
u0.05 =1.645. 标准正态分布的上侧分位数u P{U<u} =1- (u) =1- (x) x O u P{U≥1.645} =0.05
2分布的上侧分位数 fn(x) x O 当n不太大时,可查附表3; 当n比较大时; 例如,
据林德伯格-莱维中心极限定理,当 时 由性质
t分布 t 分布的数学期望与方差 设随机变量X~N(0,1),Y~ 2(n) ,且X与Y相互独立,则称统计量 服从自由度为n的t分布,记为 设T~t (n),则E(T)=0,D(T)=
t分布的上侧分位数t(n) t t(n) t1- (n) t(n)=-t1- (n) f(t) O 当n较小时,可查表; t(n)≈u
F分布 F~F(n1,n2). 设随机变量X~ 2(n1),Y~ 2(n2),且相互独 立,则称随机变量 服从第一自由度为n1,第二自由度为n2的F分布, 记作 F~F(n1,n2). 性质1 若F~F(n1,n2),则 ~F(n2,n1).
U2~2(1), ~ F(1, n). 例 若T~t(n), 问T2服从什么分布? 解 因为T~t(n), 可以认为 其中U~N(0,1), V~2(n),且U,V独立 U2~2(1), ~ F(1, n).
F分布的上侧分位数F(n1,n2) f(x) x O F(n1, n2) 值较小时,可查表; 当 较大时,可以由公式 得出
证明
抽样分布定理 设(X1,X2,…,Xn)为来自正态总体 X~N( , 2)的样本,则 (1) 样本均值 与样本方差S 2相互独立;(证明,略) (2) (证明,略) (3) (4)
例 设(X1,X2,…,Xn)为取自正态总体X~N( , 2) 的样本,则
例 设(X1,X2,…,Xn)为取自正态总体 的样本,(Y1,Y2,…,Ym)为取自正态总体 的样本。X与Y独立,则 的 则
证明 设(X1,X2,…,Xn)为来自正态总体 由于 与S 2相互独立,则U,V相互独立
且U,V相互独立, 由F分布的定义有 例 设 为正态总体 的样本容量和样本方差;设 为正态总体 的样本容量和样本方差。设两个总体相互独立,则 例 设 为正态总体 的样本容量和样本方差;设 为正态总体 的样本容量和样本方差。设两个总体相互独立,则 证明 且U,V相互独立, 由F分布的定义有
~t(2). Xi~N(0,1),i=1, 2, …, n.且相互独立 X1-X2 ~N(0, 2), 例 设总体X~N(0,1), X1,X2,…,Xn为简单随机样本,试问下列统计量各服从什么分布? Xi~N(0,1),i=1, 2, …, n.且相互独立 解 (1) X1-X2 ~N(0, 2), 且U,V相互独立 ~t(2).
~t(n-1). 例 设总体X~N(0,1), X1,X2,…,Xn为简单随机样本,试问下列统计量各服从什么分布? (2) 且U,X1相互独立 ~t(n-1).
~F(3,n-3). 例 设总体X~N(0,1), X1,X2,…,Xn为简单随机样本,试问下列统计量各服从什么分布? (3) 且U,V相互独立 ~F(3,n-3).
例 设总体X~N( , 42), X1,X2,…,X10是简单随机样本, S2为样本方差,已知P{S2>}=0.1,求 . 因为n=10,n-1=9, 2=42, 解 所以 ~2(9). 又 P{S2> }= =0.1, 所以 ≈14.684. 故 ≈26.105
例 从正态总体 中,抽取了 n = 20的样本 (1) 求 (2) 求 解 (1) 即
(2)
例 设X 与Y 相互独立,X ~ N(0,16),Y ~ N(0,9) , X1, X2 ,…, X9 与Y1, Y2 ,…, Y16分别是取自 X 与 Y 的简单随机样本, 求统计量 所服从的分布. 解 U,V相互独立