Download presentation
Presentation is loading. Please wait.
1
区间估计 Interval Estimation
2
相关数学英文词汇 点估计: Point Estimation 区间估计: Interval Estimation
置信区间: Confidence Interval
3
区间估计的思想 点估计总是有误差的,但没有衡量偏差程度的量, 区间估计则是按一定的可靠性程度对待估参数给出一个 区间范围。
4
置信水平、置信区间 设总体的分布中含有一个参数,对给定的,如果 由样本(X1,X2,…,Xn)确定两个统计量
( X1,X2,…,Xn ), ( X1,X2,…,Xn ), 使得 则称随机区间,( )为 参数的置信系数为1- 的置信区间。 :置信水平 ——置信下限 ——置信上限
5
正态总体方差已知,对均值的区间估计 如果总体X~N(,2),其中2已知, 未知, 则取U-统计量 ,对做区间估计。
对给定的置信水平1-,由 确定临界值(X的双侧分位数)得的置信区间为 将观测值 代入,则可得具体的区间。
6
几点说明 1、参数的置信水平为1-的置信区间( 1, 2) 表示该区间有100(1-)%的可能性包含总体参 数的真值。
2、不同的置信水平,参数的置信区间不同。 3、置信区间越小,估计越精确,但置信水平会降低; 相反,置信水平越大,估计越可靠,但精确度会降 低,置信区间会较长。一般:对于固定的样本容量, 不能同时做到精确度高(置信区间小),可靠程度也 高(1- 大)。如果不降低可靠性,而要缩小估计范 围,则必须增大样本容量,增加抽样成本。
7
a q - = £ 1 } ˆ { P ] ˆ , [ q q ˆ q 和 a - 1 一、 置信区间定义: 设 是 一个待估参数,给定
满足 设 是 一个待估参数,给定 若由样本X1,X2,…Xn确定的两个统计量 a q - = 1 } ˆ { 2 P ] ˆ , [ 2 1 q 则称区间 是 的置信水平(置信度、置信概率)为 的置信区间. q a - 1 2 1 ˆ q 和 分别称为置信下限和置信上限.
8
一旦有了样本,就把 估计在区间 q ˆ q = ˆ q = ] ˆ , [ q q 可见,
对参数 作区间估计,就是要设法找出两个只依赖于样本的界限(构造统计量) q 1 ˆ q = (X1,…Xn) 2 ˆ q = (X1,…Xn) 一旦有了样本,就把 估计在区间 ] ˆ , [ 2 1 q q 内. 这里有两个要求:
9
q ] ˆ , [ q 1. 要求 以很大的可能被包含在区间 内,就是说,概率 要尽可能大. 即要求估计尽量可靠.
2 1 q 1. 要求 以很大的可能被包含在区间 q } ˆ { 2 1 q P 内,就是说,概率 要尽可能大. 即要求估计尽量可靠. 2. 估计的精度要尽可能的高. 如要求区间 长度 尽可能短,或能体现该要求的其它准则. 1 2 ˆ q - 可靠度与精度是一对矛盾, 一般是在保证可靠度的条件下 尽可能提高精度.
10
m a - 1 二、置信区间的求法 例1 设X1,…Xn是取自 的样本, 求参数 的置信度为 的置信区间. 解: 选 的点估计为
求参数 的置信度为 的置信区间. a - 1 m 解: 选 的点估计为 X ~N(0, 1) 寻找一个待估参数和 估计量的函数 ,要求 其分布为已知. 有了分布,就可以求出 U取值于任意区间的概率.
11
对给定的置信水平 查正态分布表得 使 对于给定的置信水平, 根据U的分布, 确定一个区间, 使得U取值于该区间的概率为 置信水平. 为什么
这样取? 查正态分布表得 使
12
对给定的置信水平 查正态分布表得 使 从中解得
13
于是所求 的 置信区间为 m ] , [ 2 a s u n X + - 2 a s u n X 也可简记为 n, s 的作用?
14
m a - 1 ~N(0, 1) 例如,由 P(-1.96≤U≤1.96)=0.95 我们得到 均值 的置信水平为 的 置信区间为 ] 96
均值 的置信水平为 的 a - 1 m 置信区间为 ] 96 . 1 , [ n X s + -
15
m a - 1 由 P(-1.75≤U≤2.33)=0.95 我们得到 均值 的置信水平为 的 置信区间为 这个区间比前面一个要长一些. [
均值 的置信水平为 的 a - 1 m 置信区间为 [ X - 1 . 75 s n , X + 2 . 33 s n ] 这个区间比前面一个要长一些.
16
例2 假设某地小学五年级学生语文统考成绩服从正态分布 N(m,s×s),已知s×s=14分。
现随机抽取27名五年级学生的成绩进行统计,平均分为78分。 试求该地小学五年级学生语文平均成绩的95%的置信区间.
17
正态总体方差未知,对均值的区间估计 如果总体X~N(,2),其中,均未知 的1-的置信区间?
18
正态总体方差未知,对均值的区间估计 如果总体X~N(,2),其中,均未知 由 构造T-统计量 当置信水平为1-时,由
从而得的置信水平为1-的置信区间为
19
正态总体方差已知,对均值的区间估计 U-统计量 构造 未知,用样本标准差 近似代替. 对大样本,由中心极限定理, 近似N(0,1)分布
20
样本均值的抽样分布 与中心极限定理 当总体服从正态分布N(μ,σ2)时,来自该总体的所有容量为n的样本的均值x也服从正态分布,x 的数学期望为μ,方差为σ2/n。即x~N(μ,σ2/n) = 50 =10 X 总体分布 n = 4 抽样分布 x n =16
21
中心极限定理 (central limit theorem)
中心极限定理:设从均值为,方差为 2的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为μ、方差为σ2/n的正态分布 当样本容量足够大时(n 30) ,样本均值的抽样分布逐渐趋于正态分布 一个任意分布的总体 x
22
中心极限定理 (central limit theorem)
x 的分布趋于正态分布的过程
23
抽样分布与总体分布的关系 总体分布 正态分布 非正态分布 大样本 小样本
24
近似N(0,1)分布
26
例3 从1998年全国文科政治高考成绩中抽取样本3 861人,
计算出第二大题的平均分为11.97分, 修正方差为4.469 试求全国文科考生政治科第二大题平均分的95%的置信区间.
27
The End 练习:Page
Similar presentations