参数估计 参数估计问题:知道随机变量(总体)的分布类型, 但确切的形式不知道,根据样本来估计总体的参数,这 类问题称为参数估计。 参数估计的类型——点估计、区间估计
参数的估计量 设总体的分布函数为F(x,)(未知),X1,X2,…,Xn 为样本,构造一个统计量 来估计 为样本,构造一个统计量 来估计 参数,则称 为参数的估计量。 将样本观测值 代入 , 得到的值 称为参数的估计值。
点估计:如果构造一个统计量 来作为参数的估计量,则称为 参数的点估计。 区间估计:如果构造两个统计量 而用 来作为参数可能取值范围的估计,称为 参数的区间估计。
参数的点估计 点估计的方法 矩法、最大似然法 矩法估计 用样本的矩作为总体矩的估计量
(大数定律)若随机变量序列{Yn}独立同分布,且有相同的数学期望.则对于任意 > 0,恒有 设X1,X2,… , Xn为来自总体X的样本,则 总体的k阶原点矩 样本的k阶原点矩
总体的 阶原点矩,记作 样本的 阶原点矩,记作 得m个方程构成方程组,解得的 即为参数 的矩估计量,代入样本观测值,即得参数 的矩估计值。
注:也可以用样本的中心矩估计相应的总体中心矩 总体的 阶中心矩,记作 样本的 阶中心矩,记作 总体的k阶中心矩 样本的k阶中心矩
例1 对容量为n的样本,求下列密度函数中参数 的 矩估计量。 解 由于 所以由矩法估计,令 解得 所以,参数 的矩估计量为
例2 设X1,X2,…,Xn为总体X的样本,试求下列总体 分布参数的矩估计量。 解 (1)由于 所以参数和2的矩估计量为 (2)由于 令 得参数p的矩估计量为
例2 设X1,X2,…,Xn为总体X的样本,试求下列总体 分布参数的矩估计量。 (3)由于 所以参数的矩估计量为 或 可见:同一个参数的矩估计量可以不同。所以统计量 存在“优、劣”之分。
例3 设总体X服从[1, 2]上的均匀分布, 1<2,求 1, 2的矩估计量, X1,X2,…,Xn为X的一个样本。 解 由于 所以由矩法估计,令 解得
例4 设某总体X的数学期望为EX=a,方差DX=b,X1, X2,…,Xn为样本,试求a和b的矩估计量。 解 总体的1,2阶原点矩分别为 样本的2阶原点矩分别为 由矩法估计,令 所以
结论:不管总体X服从何种分布,总体期望和方差 的矩估计量分别为样本均值和 ,即 估计值为
假设在一个罐中放着许多白球和黑球,并假定已经知道两种球的数目之比是1:3,但不知道哪种颜色的球多。如果用放回抽样方法从罐中取5个球,观察结果为: 黑、白、黑、黑、白,估计黑球的概率p.
似然函数的定义
最大似然估计法
例5 解 似然函数
对数似然函数
例6 解
似然函数的定义
例7 解
例8 解 似然函数为
它们与相应的矩估计量相同.
例9 设某总体X的密度为 (X1,X2,…,Xn)为取自X的样本, 试求的矩估计量和最大似然估计量。 矩估计 的矩估计量
最大似然估计 的最大似然估计量
例10 设某总体X的分布律为 现得到样本观测值为2,3,2,1,3, 试求的矩估计量和最大似然估计量。 矩估计 的矩估计量
最大似然估计 的最大似然估计量
对于同一个参数,用不同的方法可以得到不同的估计量. 现在的问题是,当同一参数出现多个估计量时,究竟哪一个更好呢 对于同一个参数,用不同的方法可以得到不同的估计量. 现在的问题是,当同一参数出现多个估计量时,究竟哪一个更好呢? 这就涉及到用什么标准来评价估计量的问题. 确定估计量好坏的标准必须是整体性的,说得明确一点就是,必须在大量观察的基础上从统计的意义上来评价估计量的好坏.也就是说,估计的好坏取决于估计量的统计性质.一般认为,一个“好”的估计量应该具有如下的条件:
一、无偏性 估计量是随机变量, 对于不同的样本值就会得到不同的估计值, 希望估计值在未知参数真值左右徘徊, 最好它的数学期望等于未知参数的真值, 这就导致了无偏性这个标准。 定义
样本方差 样本均值 是EX的无偏估计, 样本方差 是DX的无偏估计。
样本二阶中心矩 如果 但, 则称 是 的渐近无偏估计量 不是DX的无偏估计, 但它是DX的渐近无偏估计.
例1 证 例2 证
二、有效性 一般来说,一个参数往往有多个无偏估计量. 若 有两个无偏估计量: , 则 当a+b=1时都是 的无偏估计量。 估计量的无偏性只保证了估计量的取值在参数真值周围波动,但是波动的幅度有多大呢?自然的, 我们希望估计量波动的幅度越小越好,幅度越小,则估计量取值与参数真值有较大偏差的可能性越小,而衡量随机变量波动幅度的量就是方差.这样就有了我们下面要介绍的有效性的概念.
定义 例3
三、相合性 定义 直观上看,当n增大时,样本信息增多,当然希望估计量越来越靠近真值的概率也越来越大, 这种想法就引出了上面的一致性概念. 一致估计量一般地是当样本容量很大时,才能显示其优点.
(大数定律)若随机变量序列{Yn}独立同分布,且有相同的数学期望.则对于任意 > 0,恒有 设X1,X2,… , Xn为来自总体X的样本,则
可以证明, 是DX的一致估计量。 样本均值是总体均值的相合(一致)估计. 样本方差是总体方差的相合(一致)估计.
引例 为了估计某厂生产的灯泡的平均使用寿命,现从中 随机抽取5只,测量其寿命如下:1455,1502,1370, 1610,1430,则该厂灯泡的平均使用寿命的点估计值为 可以认为该种灯泡的使用寿命在1473.4个单位时间左右, 但范围有多大呢?又有多大的可能性在这“左右”呢?
( ) 也就是说,我们希望确定一个(随机)区间,使我们能以比较高的可靠程度相信它包含真参数值. 真值 ( ) 这里所说的“可靠程度”是用概率来度量的 , 称为置信度或置信水平. 习惯上把置信水平记作 ,这里 是一个 很小的正数.
不同的置信水平,参数的置信区间不同.
要求 以很大的可能被包含在置信区间内,就是说 , 概率 要尽可能大,即要求估计尽量可靠.区间的长度反映了估计的精度. 区间估计中的精确性与可靠性是相互矛盾的.当样本容量一定时,提高估计的可靠度,将降低估计的精度;相反,提高估计的精度,将降低估计的可靠度.在实际使用中,总是在保证一定的可靠度的情况下尽可能地提高其精度.
区间估计的步骤
正态总体方差已知,对均值的区间估计 u/2 /2 -u/2 x (x) 如果总体X~N(,2),其中2已知,未知, 对给定的置信水平1-,对做区间估计。 取U-统计量 (x) O u/2 /2 -u/2 x 从而得的置信水平为1-的置信区间为
例1 某车间生产滚珠,从长期实践中知道,滚珠直径X 可以认为服从正态分布,从某天的产品中随机抽取6个, 测得直径为(单位:cm) 14.6,15.1,14.9,14.8,15.2,15.1 若已知方差为0.06,分别求在置信度为0.95和0.99的 平均直径EX的置信区间.
由题设知X~N(,0.06) EX的置信区间为 当=0.05时, 所以,EX的置信区间为(14.754,15.146) 当=0.01时, 所以,EX的置信区间为(14.692,15.208) 置信水平提高,置信区间扩大,估计精确度降低。
正态总体方差未知,对均值的区间估计 t/2 (n-1) /2 - t/2(n-1) f(t) 如果总体X~N(,2),其中,均未知. 对给定的置信水平1-,对做区间估计 由 构造T-统计量 f(t) O t/2 (n-1) /2 - t/2(n-1) 从而得的置信水平为1-的置信区间为
例2 某厂生产的一种塑料口杯的重量X被认为服从正态 分布,今随机抽取9个,测得其重量为(单位:克): 21.1,21.3,21.4,21.5,21.3,21.7,21.4,21.3, 21.6。试用95%的置信度估计全部口杯的平均重量。 解 由题设可知:口杯的重量X~N(,2) 由抽取的9个样本,可得 得 由 查表得 全部口杯的平均重量的置信区间为(21.26,21.54)
例3 随机从一批钉子中抽取6枚钉子,测得长度分别为 2.14, 2.10, 2.15,2.10,2.13,2.12 (单位:厘米) 并设总体X~N(,2),求下列两种情况下的置信度 为90%的置信区间. (1) 2 =0.01; (2) 2未知 (1)的置信度为90%的置信区间为(2.056,2.190). (2)的置信度为90%的置信区间为(2.106,2.140).
正态总体均值已知,对方差的区间估计 x f(x) 如果总体X~N(,2),其中已知,2未知 对给定的置信水平1-,对2做区间估计 由 f(x) x O 构造2-统计量 从而得2的置信水平为1-的置信区间为
例4 已知某种果树产量服从N(218,2),随机 抽取6棵计算其产量为(单位:kg) 221,191,202,205,256,236 试以95%的置信水平估计产量的方差。 解 计算 果树方差的置信区间为
正态总体均值未知,对方差的区间估计 x f(x) 如果总体X~N(,2),其中, ,2未知 对给定的置信水平1-,对2做区间估计 构造2-统计量 f(x) x O 从而得2的置信水平为1-的置信区间为
例5 设某灯泡的寿命X~N(,2), ,2未知,现 从中任取5个灯泡进行寿命试验,得数据10.5,11.0, 11.2,12.5,12.8(单位:千小时),求置信水平为 90%的2的区间估计。 解 样本方差及均值分别为 由 得 查表得 2的置信水平为90%的置信区间为(0.4195,5.5977)
正态分布总体对均值的区间估计 (1)方差已知,对均值的区间估计 (2)方差未知,对均值的区间估计
正态分布总体对方差的区间估计 (3)均值已知,对方差的区间估计 (4)均值未知,对方差的区间估计