第 6 章 统计量及其抽样分布 作者:中国人民大学统计学院 贾俊平 PowerPoint 统计学
第 6 章 统计量及其抽样分布 6.1 统计量 6.2 关于分布的几个概念 6.3 由正态分布导出的几个重要分布 第 6 章 统计量及其抽样分布 6.1 统计量 6.2 关于分布的几个概念 6.3 由正态分布导出的几个重要分布 6.4 样本均值的分布与中心极限定理 6.5 样本比例的抽样分布 6.6 两个样本平均值之差的分布 6.7 关于样本方差的分布
学习目标 了解统计量及其分布的几个概念 了解由正态分布导出的几个重要分布 理解样本均值的分布与中心极限定理 掌握单样本比例和样本方差的抽样分布
6.1 统计量 6.1.1 统计量的概念 6.1.2 常用统计量 6.1.3 次序统计量 6.1.4 充分统计量
统计量 (statistic) 设X1,X2,…,Xn是从总体X中抽取的容量为n的一个样本,如果由此样本构造一个函数T(X1,X2,…,Xn),不依赖于任何未知参数,则称函数T(X1,X2,…,Xn)是一个统计量 样本均值、样本比例、样本方差等都是统计量 统计量是样本的一个函数 统计量是统计推断的基础
次序统计量 一组样本观测值X1,X2,…,Xn由小到大的排序 X(1)≤X(2)≤…≤ X(i)≤…≤ X(n) 中位数、分位数、四分位数等都是次序统计量
6.2 关于分布的几个概念 6.2.1 抽样分布 6.2.2 渐进分布 6.2.3 随机模拟获得的近似分布
抽样分布 (sampling distribution) 样本统计量的概率分布,是一种理论分布 在重复选取容量为n的样本时,由该统计量的所有可 能取值形成的相对频数分布 随机变量是 样本统计量 样本均值, 样本比例,样本方差等 结果来自容量相同的所有可能样本 提供了样本统计量长远而稳定的信息,是进行推 断的理论基础,也是抽样推断科学性的重要依据
6.3 由正态分布导出的几个重要分布 6.3.1 2分布 6.3.2 t 分布 6.3.3 F 分布
2 分布
2分布 (2 distribution) 由阿贝(Abbe) 于1863年首先给出,后来由海尔墨 特(Hermert)和卡·皮尔逊(K·Pearson) 分别于1875 年和1900年推导出来 设 ,则 令 ,则 Y 服从自由度为1的2分布,即 当总体 ,从中抽取容量为n的样本,则
2分布 (性质和特点) 分布的变量值始终为正 分布的形状取决于其自由度n的大小,通常为不 对称的正偏分布,但随着自由度的增大逐渐趋 于对称 期望为:E(2)=n,方差为:D(2)=2n(n为自由 度) 可加性:若U和V为两个独立的2分布随机变量 ,U~2(n1),V~2(n2),则U+V这一随机变量服 从自由度为n1+n2的2分布
c2分布 (图示) c 2 不同容量样本的抽样分布 n=1 n=4 n=10 n=20 The sampling distribution is a function of the sample sizes upon which the sample variances are based. Hint: Recall the formula for variance! s2 = S(x -`x)2/(n-1) 65
t 分布
t 分布 高塞特(W.S.Gosset)于1908年在一篇以“Student”(学生)为笔名的论文中首次提出 一个特定的分布依赖于称之为自由度的参数。随着自由度的增大,分布也逐渐趋于正态分布 As a result of this class, you will be able to ...
t 分布图示 t x z t (df = 13) t (df = 5) 不同自由度的t分布 t 分布与标准正态分布的比较 标准正态分布 As a result of this class, you will be able to ...
F 分布
F分布 (F distribution) 由统计学家费希尔(R.A.Fisher) 提出的,以其姓氏 的第一个字母来命名 设若U为服从自由度为n1的2分布,即U~2(n1),V 为服从自由度为n2的2分布,即V~2(n2),且U和V相 互独立,则称F为服从自由度n1和n2的F分布,记为
F分布 (图示) 不同自由度的F分布 F (1,10) (5,10) (10,10) As a result of this class, you will be able to ...
6.4 样本均值的分布与中心极限定理
样本均值的抽样分布 在重复选取容量为n的样本时,由样本均 值的所有可能取值形成的相对频数分布 一种理论概率分布 推断总体均值的理论基础
样本均值的抽样分布 与中心极限定理 当总体服从正态分布N(μ,σ2)时,来自该总体的所有容量为n的样本的均值x也服从正态分布,x 的数学期望为μ,方差为σ2/n。即x~N(μ,σ2/n) = 50 =10 X 总体分布 n = 4 抽样分布 x n =16
中心极限定理 (central limit theorem) 从均值为,方差为 2的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为μ、方差为σ2/n的正态分布 当样本容量足够大时(n 30) ,样本均值的抽样分布逐渐趋于正态分布 一个任意分布的总体 x
中心极限定理 (central limit theorem) x 的分布趋于正态分布的过程
6.5 样本比例的抽样分布
比例 (proportion) 总体(或样本)中具有某种属性的单位与全部单位 总数之比 总体比例可表示为 样本比例可表示为 不同性别的人与全部人数之比 合格品(或不合格品) 与全部产品总数之比 总体比例可表示为 样本比例可表示为
样本比例的抽样分布 在重复选取容量为n的样本时,由样本比 例的所有可能取值形成的相对频数分布 一种理论概率分布 当样本容量很大时,样本比例的抽样分布 可用正态分布近似 推断总体比例的理论基础
样本比例的抽样分布 (数学期望与方差) 样本比例的数学期望 样本比例的方差 重复抽样 不重复抽样
6.6 两个样本均值之差的抽样分布
两个样本均值之差的抽样分布 两个总体都为正态分布,即 , 两个样本均值之差 的抽样分布服从正态分 布,其分布的数学期望为两个总体均值之差 两个总体都为正态分布,即 , 两个样本均值之差 的抽样分布服从正态分 布,其分布的数学期望为两个总体均值之差 方差为各自的方差之和
6.7 关于样本方差的分布 6.7.1 样本方差的分布 6.7.2 两个样本方差比的分布
样本方差的分布 在重复选取容量为n的样本时,由样本方差的所有可能取值形成的相对频数分布 对于来自正态总体的简单随机样本,则比值 As a result of this class, you will be able to ...
两个样本方差比的分布 两个总体都为正态分布,即X1~N(μ1 ,σ12),X2~N(μ2 ,σ22 ) 从两个总体中分别抽取容量为n1和n2的独立样本 两个样本方差比的抽样分布,服从分子自由度为(n1-1),分母自由度为(n2-1) 的F分布,即 As a result of this class, you will be able to ...
本章小结 统计量及其分布 由正态分布导出的几个重要分布 样本均值的分布与中心极限定理 样本比例的抽样分布 两个样本平均值之差的分布 关于样本方差的分布
结 束 THANKS