第六章 参数估计 §6.1 点估计的几种方法 §6.2 点估计的评价标准 §6.3 最大似然估计 §6.4 最小方差无偏估计

Slides:



Advertisements
Similar presentations
統計學 : 應用與進階 第 11 章 : 點估計.  點估計  類比原則  最大概似法  不偏性  有效性  一致性.
Advertisements

15.3 分式方程 第1课时.
XX啤酒营销及广告策略.
成功八步 成功一定有方法 失败一定有原因 银河系统.
大稻埕課程 統整篇.
8月1日后全国营改增我们怎么办? 营改增新政策深度解析 得法网财税讲师 樊剑英.
第二章 复式记账原理*** 主要内容、重点难点: 1.会计要素与会计等式*** 2.会计科目与账户*** 3. 借贷记账法***
返本归原在课文,精讲多练会高考 ——2012届高三语文复习的几点做法.
探索确定位置的方法 王积羽.
估計的基本概念 估計量之性質 估計之方法 區間估計之基本概念 平均數之區間估計 樣本大小.
人群健康研究的统计方法 预防医学系 指导教师:方亚 电话:
学业考试命题策略 牛学文 浙江省教育厅教研室.
2011年10月31日是一个令人警醒的日子,世界在10月31日迎来第70亿人口。当日凌晨,成为象征性的全球第70亿名成员之一的婴儿在菲律宾降生。 ?
郑州轻工业学院数学与信息科学系 第七章:参 数 估 计 概率统计教研组.
Statistical Probability for Production Simulation
知使命 尽职责 护“财富” 努力当好“保健医生” 中共深圳市纪委退休干部 张定坤
  厦门市诗坂中学 陈苑然.
中台灣的故事─ 彰化、台中、南投,從日治到近代
1、分别用双手在本上写下自己的名字 2、双手交叉
初级会计实务 第八章 产品成本核算 主讲人:杨菠.
就 业 协 议 书 将此幻灯片插入到演示文稿中 将此模板作为演示文稿(.ppt 文件)保存到计算机上。 打开将包含图像幻灯片的演示文稿。
2007年11月考试相关工作安排 各考试点、培训中心和广大应考人员:
教材:模式识别(第三版) 张学工编著 清华大学出版社
一元一次方程的应用 行程问题.
中考阅读 复习备考交流 西安铁一中分校 向连吾.
分式的乘除(1) 周良中学 贾文荣.
第四章 制造业企业 主要经济业务核算.
《思想品德》七年级下册 教材、教法与评价的交流 金 利 2006年1月10日.
财经法规与会计职业道德 (3) 四川财经职业学院.
中央广播电视大学开放教育 成本会计(补修)期末复习
二综防火设计分析.
人教版义务教育课程标准实验教科书 小学数学四年级上册第七单元《数学广角》 合理安排时间 248.
市级个人课题交流材料 《旋转》问题情境引入的效果对比 高淳县第一中学 孔小军.
常用逻辑用语复习.
第三章 参数估计 Parametric Estimation
温 馨 提 示 感谢您从“河姆渡教师教育网”下载使用该PPT文件,仅供学习参考,未经作者同意勿在公开场合使用,谢谢合作!
我国三大自然区.
实际问题与一元二次方程(四).
第十二单元 第28讲 第28讲 古代中国的科技和文艺   知识诠释  思维发散.
我是情緒管理小高手 黃玲蘭老師.
中考语文积累 永宁县教研室 步正军 2015.9.
小学数学知识讲座 应用题.
北师大版七年级数学 5.5 应用一元一次方程 ——“希望工程”义演 枣庄市第三十四中学 曹馨.
倒装句之其他句式.
台灣的自然環境 第一課 位置與範圍.
海洋存亡 匹夫有责 ——让我们都来做环保小卫士 XX小学三(3)班.
三角形的邊角關係 大綱:三角形邊的不等關係 三角形邊角關係 樞紐定理 背景知識:不等式 顧震宇 台灣數位學習科技股份有限公司.
Population proportion and sample proportion
8.2 参数估计 §8.2.1 基本概念 一、估计量 估计值 人们往往知道随机变量(总体)的分布类型,但确切的函数形式并不知道,即总体的参数未知。参数估计就是要根据样本来估计出总体的未知参数。
模式识别 Pattern Recognition
第 22 课 孙中山的民主追求 1 .近代变法救国主张的失败教训: “师夷之长技以制 夷”“中体西用”、兴办洋务、变法维新等的失败,使孙中山
Properties of Continuous probability distributions
Sampling Theory and Some Important Sampling Distributions
Interval Estimation區間估計
第五章 统计量及其分布 §5.1 总体与样本 §5.2 样本数据的整理与显示 §5.3 统计量及其分布 §5.4 三大抽样分布
统 计 学 (第三版) 2008 作者 贾俊平 统计学.
第 9 章 估 計.
相關統計觀念復習 Review II.
The Bernoulli Distribution
商用統計學 Chapter 7 估計.
课前注意 课前注意 大家好!欢迎加入0118班! 请注意以下几点: 1.服务:卡顿、听不清声音、看不见ppt—管家( ) 2.课堂秩序:公共课堂,勿谈与课堂无关或消极的话题。 3.答疑:上课听讲,课后答疑,微信留言。 4.联系方式:提示老师手机/微信: QQ:
基础会计.
数轴、相反数与绝对值 本节内容 本课内容 1.2.
第八节 算术运算符和算术表达式.
數學科98課綱 種子教師培訓課程 (四) 教學示例
概率论与数理统计.
統計網路學習館 線性迴歸.
畢氏定理(百牛大祭)的故事 張美玲 製作 資料來源:探索數學的故事(凡異出版社).
我们探究学习 成果 直线的 倾斜角与斜率.
102年人事預算編列說明 邁向頂尖大學辦公室製作.
Presentation transcript:

第六章 参数估计 §6.1 点估计的几种方法 §6.2 点估计的评价标准 §6.3 最大似然估计 §6.4 最小方差无偏估计 §6.1 点估计的几种方法 §6.2 点估计的评价标准 §6.3 最大似然估计 §6.4 最小方差无偏估计 §6.6 区间估计

一般常用 表示参数,参数 所有可能取值组成 的集合称为参数空间,常用表示。参数估计问 题就是根据样本对上述各种未知参数作出估计。 参数估计的形式有两种:点估计与区间估计。

其一 是如何给出估计,即估计的方法问题; 其二 是如何对不同的估计进行评价,即估 计的好坏判断标准。 设 x1, x2,…, xn 是来自总体 X 的一个样本,我 们用一个统计量 的取值作为 的估计值,称 为 的点估计(量),简称估 计。在这里如何构造统计量 并没有明确的 规定,只要它满足一定的合理性即可。这就 涉及到两个问题: 其一 是如何给出估计,即估计的方法问题; 其二 是如何对不同的估计进行评价,即估 计的好坏判断标准。

6.1 点估计的几种方法 6.1.1 替换原理和矩法估计 一、矩法估计 替换原理是指用样本矩及其函数去替换相应的总体矩及其函数,譬如: 用样本均值估计总体均值E(X),即 ; 用样本方差估计总体方差Var(X),即 用样本的 p 分位数估计总体的 p 分位数, 用样本中位数估计总体中位数。

例6.1.1 对某型号的20辆汽车记录其每加仑汽油的行驶里程(km),观测数据如下: 29.8 27.6 28.3 27.9 30.1 28.7 29.9 28.0 27.9 28.7 28.4 27.2 29.5 28.5 28.0 30.0 29.1 29.8 29.6 26.9 经计算有 由此给出总体均值、方差和中位数的估计分别为: 28.695, 0.9185 和 28.6。 矩法估计的实质是用经验分布函数去替换总体分布,其理论基础是格里纹科定理。

设总体具有已知的概率函数 P(x, 1, …, k), x1, x2 , …, xn 是样本,假定总体的k阶原点矩k存在 ,若1, …, k 能够表示成 1, …, k 的函数j = j(1, …,k),则可给出诸j 的矩法估计为 其中

例6.1.2 设总体服从指数分布,由于EX=1/, 即 =1/ EX,故 的矩法估计为 另外,由于Var(X)=1/2,其反函数为 因 此,从替换原理来看,的矩法估计也可取为 s 为样本标准差。这说明矩估计可能是不唯一的, 这是矩法估计的一个缺点,此时通常应该尽量采用 低阶矩给出未知参数的估计。

例6.1.3 x1, x2, …, xn是来自(a,b)上的均匀分布 U(a,b)的样本,a与b均是未知参数,这里k=2, 由于 不难推出 由此即可得到a, b的矩估计:

6.2 点估计的评价标准 6.2.1 相合性 Consistency 我们知道,点估计是一个统计量,因此它是一个随 机变量,在样本量一定的条件下,我们不可能要求 它完全等同于参数的真实取值。但如果我们有足够 的观测值,根据格里纹科定理,随着样本量的不断 增大,经验分布函数逼近真实分布函数,因此完全 可以要求估计量随着样本量的不断增大而逼近参数 真值,这就是相合性,严格定义如下。

定义6.2.1 设 ∈Θ为未知参数, 是 的一个估计量,n 是样本容量,若对任何 一个ε>0,有 (6.2.1) 则称 为 参数的相合估计。

相合性被认为是对估计的一个最基本要求, 如果 一个估计量, 在样本量不断增大时,它都不能把 被估参数估计到任意指定的精度, 那么这个估计 是很值得怀疑的。 通常, 不满足相合性要求的估计一般不予考虑。证 明估计的相合性一般可应用大数定律或直接由定 义来证.

若把依赖于样本量n的估计量 看作一个随机变量序列,相合性就是 依概率收敛于,所以证明估计的相合性可应用依概率收敛的性质及各种大数定律。

计, =g(1 , …, k) 是1, …, k 的连续函数,则 是 的相合估计。 在判断估计的相合性时下述两个定理是很有用的。 定理6.2.1 设 是 的一个估计量,若 则 是 的相合估计, 定理6.2.2 若 分别是1, …, k 的相合估 计, =g(1 , …, k) 是1, …, k 的连续函数,则 是 的相合估计。

例6.2.2 设 x1, x2 , …, xn 是来自均匀总体U(0,  )的样本,证明 的极大似然估计是相合估计。 证明:在例6.1.7中我们已经给出 的极大似然估计是 x(n)。由次序统计量的分布,我们知道 x(n) 的分布密度函数为 p(y)=nyn-1/ n, y <, 故有 由定理6.2.1可知,x(n)是 的相合估计。

样本均值是总体均值的相合估计; 样本标准差是总体标准差的相合估计; 样本变异系数是总体变异系数的相合估计。 由大数定律及定理6.2.2,我们可以看到: 矩估计一般都具有相合性。比如: 样本均值是总体均值的相合估计; 样本标准差是总体标准差的相合估计; 样本变异系数是总体变异系数的相合估计。

无偏性 Unbiasedness 定义6.2.2 设 是 的一个估计,  的参数空间为Θ,若对任意的∈Θ,有 定义6.2.2 设 是 的一个估计,  的参数空间为Θ,若对任意的∈Θ,有 则称 是 的无偏估计,否则称为有偏估计。

例6.2.4 对任一总体而言,样本均值是总体均值的无 偏估计。当总体k阶矩存在时,样本k阶原点矩ak是 总体k阶原点矩 k的无偏估计。但对中心矩则不一 样,譬如,由于 ,样本方差s*2不是总 体方差 2的无偏估计,对此,有如下两点说明: (1) 当样本量趋于无穷时,有E(s*2)  2, 我们称 s*2 为 2的渐近无偏估计。 (2) 若对s*2作如下修正: , 则 s2 是总体方差的无偏估计。

例6.2.5 设总体为N( , 2),x1 , x2 , …, xn是样本,则 s2是 2的无偏估计,且可求出 利用修正技术可得 cn s 是 的无偏估计,其中 是修偏系数. 可以证明,当n时, 有cn1. 这说明 s 是  的渐近无偏估计。

有效性 Effectiveness 定义6.2.3 设 是 的两个无偏估计,如果对任意 的 ∈Θ, 有 定义6.2.3 设 是 的两个无偏估计,如果对任意 的 ∈Θ, 有 且至少有一个 ∈Θ使得上述不等号严格成立,则称 比 有效。

例6.2.6 设 x1, x2 , …, xn 是取自某总体的样本,记总体 均值为 ,总体方差为 2,则 , , 都是 的无偏估计,但

例6.2.7 均匀总体U(0,  )中 的极大似然估计是x(n),由于 ,所以x(n)不是 的无偏估计,而是 的渐近无偏估计。经过修偏后可以得到 的一个无偏估计: 。且 另一方面,由矩法我们可以得到 的另一个无偏估 计 ,且 由此,当n>1时, 比 有效。

Maximum likelihood Estimation 6.3 极(最)大似然估计 Maximum likelihood Estimation 极大似然原理的直观想法是:一个随机试验如有 若干个可能的结果A,B,C,…。若在一次试验 中,结果A出现,则一般认为试验条件对A出现有 利,也即A出现的概率很大。 思想(idea) 在已经得到试验结果的情况下,我们应该寻找 使这个结果出现的可能性最大的那个 作为真 的估计

最大似然估计提供了一种给定观察数据来评估模 型参数的方法,即:“模型已定,参数未知”。 简单而言,假设我们要统计全国人口的身高,首 先假设这个身高服从服从正态分布,但是该分布 的均值与方差未知。我们没有人力与物力去统计 全国每个人的身高,但是可以通过采样,获取部 分人的身高,然后通过最大似然估计来获取上述 假设中的正态分布的均值与方差。

定义6.3.1 设总体的概率函数为P(x; ),是参数  可能取值的参数空间,x1, x2 , …, xn 是样本, 将样本的联合概率函数看成 的函数,用L( ; x1, x2, …, xn) 表示,简记为L( ), 称为样本的似然函数。 如果某统计量 满足 则称 是 的极(最)大似然估计,简记为MLE( Maximum Likelihood Estimate)。

求极大似然函数估计值的一般步骤: (1) 写出似然函数; (2) 对似然函数取对数,并整理; (3) 求导数; (4) 解似然方程; (5) 判断最大值 人们通常更习惯于由对数似然函数lnL( )出发寻 找 的极大似然估计。 当L( )是可微函数时,求导是求极大似然估计最 常用的方法,对lnL( )求导更加简单些。

例6.3.6 设一个试验有三种可能结果,其发生概率 分别为 现做了n次试验,观测到三种结果发生的次数分别 为 n1 , n2 , n3 (n1+ n2+ n3 = n),则似然函数为 其对数似然函数为

将之关于 求导,并令其为0得到似然方程 解之,得 由于 所以 是极大值点。

例6.3.7 对正态总体N(, 2),θ=(, 2)是二维参 数,设有样本 x1, x2 , …, xn,则似然函数及其对 数分别为

将 lnL(, 2) 分别关于两个分量求偏导并令其为0, 即得到似然方程组 (6.3.9) (6.3.10)

利用二阶导函数矩阵的非正定性可以说明上述估 计使得似然函数取极大值。 解此方程组,由(6.3.9)可得 的极大似然估计为 将之代入(6.3.10),得出 2的极大似然估计 利用二阶导函数矩阵的非正定性可以说明上述估 计使得似然函数取极大值。

极大似然估计有一个简单而有用的性质:如果 虽然求导函数是求极大似然估计最常用的方法,但并不是在所有场合求导都是有效的。 极大似然估计有一个简单而有用的性质:如果 是 的极大似然估计,则对任一函数 g( ),其极大似然估计为 。该性质称为极大似然估计的不变性,从而使一些复杂结构的参数的极大似然估计的获得变得容易了。

例6.3.9 设 x1 , x2 , …, xn是来自正态总体N( , 2) 的样本,则和 2的极大似然估计为 , 于是由不变性可得如下参数的极大似然估计,它 们是: 标准差 的MLE是 ;

总体0.90分位数 x0.90=  + u0.90 的MLE是 ,其中u0.90为标准正态分布的0.90分位数。

总结: 极大似然估计,只是一种概率论在统计学的应用,它 是参数估计的方法之一。 已知某个随机样本满足某种概率分布,但是其中具体 的参数不清楚,参数估计就是通过若干次试验,观察 其结果,利用结果推出参数的大概值。极大似然估计 是建立在这样的思想上:已知某个参数能使这个样本 出现的概率最大,我们当然不会再去选择其他小概率 的样本,所以干脆就把这个参数作为估计的真实值。 确定最大似然估计量的问题归结为微分学求最大值问 题 当然极大似然估计只是一种粗略的数学期望,要知道 它的误差大小还要做区间估计。

minimum-variance unbiased estimator 6.4 最小方差无偏估计 minimum-variance unbiased estimator 統計學上, 最小方差無偏估計(minimum-variance unbiased estimator,簡寫為MVUE)是一個對於所有無偏估計中,擁有最小方差的無偏估計。若無論真實參數值θ是多少,最小方差無偏估計(MVUE)都比其他不偏估計有更小或至多相等的方差,則稱此估計為一致最小方差無偏估計(uniformly minimum-variance unbiased estimator,簡寫為UMVUE) -from Wikipedia

Among unbiased estimators, one important goal is to find an estimator that has as small a variance as possible, A more precise goal would be to find an unbiased estimator that has uniform minimum variance. --US Arizona U

6.4.2 一致最小方差无偏估计 定义6.4.1 对参数估计问题,设 是 的一个无 偏估计,如果对另外任意一个 的无偏估计 , 定义6.4.1 对参数估计问题,设 是 的一个无 偏估计,如果对另外任意一个 的无偏估计 , 在参数空间Θ上都有 则称 是 的一致最小方差无偏估计,简记为 UMVUE。 如果UMVUE存在,则它一定是充分统计量的函数。

关于UMVUE,有如下一个判断准则。 定理6.4.1 设 x=(x1, x2 , …, xn) 是来自某总体的一个样本, 是 的一个无偏估计, 如果对任意一个满足E((x))=0的(x),都有 则 是 的UMVUE。

例6.4.2 设 x1,x2 ,…,xn 是来自指数分布Exp(1/ )的样本,则T = x1+…+xn 是 的充分统计量,而 是 的无偏估计。设 =(x1 , x2 , …, xn)是0的任一无偏估计,则 两端对 求导得 这说明 ,从而 , 由定理6.4.1,它是 的UMVUE。

6.4.1 Rao-Blackwell定理 定理6.4.2 设总体概率函数是 p(x,  ), x1, x2 , …, xn 是其样本,T=T(x1, x2 , …, xn )是 的充分统计量,则 对 的任一无偏估计 ,令 , 则 也是 的无偏估计,且

定理6.4.2说明:如果无偏估计不是充分统计 量的函数,则将之对充分统计量求条件期 望可以得到一个新的无偏估计,该估计的 方差比原来的估计的方差要小,从而降低 了无偏估计的方差。换言之,考虑 的估 计问题只需要在基于充分统计量的函数中 进行即可,该说法对所有的统计推断问题 都是正确的,这便是所谓的充分性原则。

例6.4.1 设 x1, x2 , …, xn 是来自b(1, p)的样本,则 是p 的充分统计量。为估计 =p2,可令 由于 ,所以 是 的无偏估计。这个只使用了两个观测值的估计并不好.下面我们用Rao-Blackwell定理对之加以改进:求 关于充分统计量 的条件期望,得

6.4.4 Cramér–Rao不等式 Inequality 定义6.4.3 设总体的概率函数 P(x, ), ∈Θ满足下列条件: (1) 参数空间Θ是直线上的一个开区间; (2) 支撑 S={x: P(x, )>0}与 无关; (3) 导数 对一切∈Θ都存在; (4) 对P(x, ),积分与微分运算可交换次序; (5) 期望 存在; 则称 为总体分布的费希尔(Fisher) 信息量。

费希尔信息量是数理统计学中一个基本概念,很多的统计结果都与费希尔信息量有关。如极大似然估计的渐近方差,无偏估计的方差的下界等都与费希尔信息量I( )有关。I( )的种种性质显示,“I( )越大”可被解释为总体分布中包含未知参数 的信息越多。

例6.4.3 设总体为泊松分布P()分布,则 于是

例6.4.4 设总体为指数分布,其密度函数为 可以验证定义6.3.2的条件满足,且 于是

定理6.4.4(Cramér–Rao不等式) 设定义6.4.2的条件满足,x1, x2 , …, xn 是来自该总体的样本,T=T(x1, x2 , …, xn )是g( )的任 一个无偏估计, 存在,且对∈Θ 中一切 ,微分可在积分号下进行,则有

g( )的有效估计,有效估计一定是UMVUE。 上式称为克拉美-罗(C-R)不等式; [g’(θ)]2/(nI( ))称为g( )的无偏估计的方差 的C-R下界,简称g( )的C-R下界。 特别,对 的无偏估计 ,有 ; 如果等号成立,则称 T=T(x1, …, xn) 是 g( )的有效估计,有效估计一定是UMVUE。

例6. 4. 5 设总体分布列为p(x, )=  x(1- )1-x, x=0,1,它满足定义6. 3 例6.4.5 设总体分布列为p(x, )=  x(1- )1-x, x=0,1,它满足定义6.3.2的所有条件,可以算得该分布的费希尔信息量为 ,若 x1, x2, …, xn 是该总体的样本,则 的C-R下界为(nI( ))-1=  (1- )/n。因为 是 的无偏估计,且其方差等于 (1- )/n,达到C-R 下界,所以 是 的有效估计,它也是 的UMVUE。

例6. 4. 6 设总体为指数分布Exp(1/ ),它满足定义6. 4. 2的所有条件,例6. 4 例6.4.6 设总体为指数分布Exp(1/ ),它满足定义6.4.2的所有条件,例6.4.4中已经算出该分布的费希尔信息量为I( ) =  -2,若x1, x2, …, xn 是样本,则 的C-R下界为(nI( ))-1= 2/n。而 是 的无偏估计,且其方差等于 2/n,达到了C-R下界,所以, 是 的有效估计,它也是 的UMVUE。

能达到C-R下界的无偏估计不多: 例6.4.7 设总体为N(0, 2 ),满足定义6.4.2的条件, 且费希尔信息量为 ,令 , 则 的C-R下界为 , 而 的UMVUE为 其方差大于C-R下界。这表明所有 的无偏估计的 方差都大于其C-R下界。

6.6 区间估计 Interval Estimation 在統計學中,一個概率樣本的置信區間(Confidence interval)是對這個樣本的某個總體參數的區間估計。置信區間展現的是這個參數的真實值有一定概率落在測量結果的周圍的程度。置信區間給出被測量參數的測量值的可信程度,即前面所要求的「一定概率」。這個概率被稱為置信水平。 舉例來說,如果在一次大選中某人的支持率為55%,而置信水平0.95上的置信區間是(50%,60%),那麼他的真實支持率有百分之九十五的機率落在百分之五十和百分之六十之間,因此他的真實支持率不足一半的可能性小於百分之2.5(假設分佈是對稱的) -wikipedia 上海师范大学 ppt (p1-3)

6.6.1 区间估计的概念 定义6.6.1 设 是总体的一个参数,其参数空间为Θ,x1, x2 , …, xn是来自该总体的样本,对给定的一个 (0< <1),若有两个统计量 和 ,若对任意的 ∈Θ,有 (6.6.1)

这里置信水平1- 的含义是指在大量使用该置信区间时,至少有100(1-)%的区间含有 。 则称随机区间[ ]为 的置信水平为1- 的 置信区间,或简称[ ]是 的1-置信区间. 和 分别称为 的(双侧)置信下限和置信上 限. 这里置信水平1- 的含义是指在大量使用该置信区间时,至少有100(1-)%的区间含有 。 置信区间-Confidence interval

例6.6.1 设x1, x2 , …, x10是来自N(, 2)的样本,则 的置信水平为1- 的置信区间为 其中, ,s 分别为样本均值和样本标准差。这 个置信区间的由来将在6.6.3节中说明,这里用它 来说明置信区间的含义。 若取 =0.10,则t0..95(9)=1.8331,上式化为

现假定 =15, 2 =4,则我们可以用随机模拟方法 由N(15,4)产生一个容量为10的样本,如下即是这样 一个样本:14.85 13.01 13.50 14.93 16.97 13.80 17.9533 13.37 16.29 12.38 由该样本可以算得 从而得到 的一个区间估计为 该区间包含 的真值--15。现重复这样的方法 100次,可以得到100个样本,也就得到100个区 间 ,我们将这100个区间画在图6.6.1上。

由图6.6.1可以看 出,这100个区间 中有91个包含参 数真值15,另外9 个不包含参数真 值。 图6.6.1  的置信水平为0.90的置信区间

取=0. 50,我们 也可以给出100个 这样的区间,见 图6. 6 取=0.50,我们 也可以给出100个 这样的区间,见 图6.6.2。可以看 出,这100个区间 中有50个包含参 数真值15,另外 50个不包含参数 真值。 图6.6.2  的置信水平为0.50的置信区间

定义6.6.2 沿用定义6.6.1的记号,如对给定的 (0< <1),对任意的∈Θ,有 (6.6.2) 称 为 的1- 同等置信区间。 同等置信区间是把给定的置信水平1- 用足了。 常在总体为连续分布场合下可以实现。

单侧置信限是置信区间的特殊情形。因此,寻求置信区间的方法可以用来寻找单侧置信限。 定义 若对给定的 (0< <1)和任意的∈Θ,有 ,则称 为 的置信水平为1- 的 (单侧)置信下限。假如等号对一切∈Θ成立,则 称 为 的1- 同等置信下限。若对给定的 (0<  <1)和任意的∈Θ,有 ,则称 为 的置信水平为1- 的(单侧)置信上限。若等号对 一切∈Θ成立,则称 为1- 同等置信上限。 单侧置信限是置信区间的特殊情形。因此,寻求置信区间的方法可以用来寻找单侧置信限。

6.6.2 枢轴量法 构造未知参数 的置信区间的最常用的方法是枢轴量 法,其步骤可以概括为如下三步: 1. 设法构造一个样本和 的函数 G=G(x1, x2 , …, xn, ) 使 得G的分布不依赖于未知参数。一般称具有这种性质 的G为枢轴量。 2. 适当地选择两个常数c,d,使对给定的 (0< <1) 有 P(c≤G≤d)=1-  3. 假如能将c≤G ≤d 进行不等式等价变形化为 则[ , ]是 的1- 同等置信区间。

满足置信度要求的c与d通常不唯一。若有可能,应选平均长度 达到最短的c与d,这在G的分布为对称分布场合通常容易实现。 关于置信区间的构造有两点说明: 满足置信度要求的c与d通常不唯一。若有可能,应选平均长度 达到最短的c与d,这在G的分布为对称分布场合通常容易实现。 实际中,选平均长度 尽可能短的c与d,这往往很难实现,因此,常这样选择 c与d,使得两个尾部概率各为 /2,即P(G<c)=P(G>d)= /2,这样的置信区间称为等尾置信区间。这是在G的分布为偏态分布场合常采用的方法。

解:(1)取x(n) (p316)作为枢轴量,其密度函数为 p(y;  )= nyn , 0<y <1; 例6.5.2 设x1, x2 , …, xn是来自均匀总体U(0,  )的 一个样本,试对给定的 (0< <1)给出 的1- 同等置信区间。 解:(1)取x(n) (p316)作为枢轴量,其密度函数为 p(y;  )= nyn , 0<y <1; (2)x(n) / 的分布函数为F(y)=yn, 0<y <1,故 P(c≤x(n)/ ≤d)= d n-cn, 因此我们可以适当地选择c和d满足d n-cn=1-

(3)利用不等式变形可容易地给出 的1-同等 置信区间为[x(n) /d,x(n) /c],该区间的平均长度 为 。不难看出,在0≤c<d≤1及dn- cn=1- 的条件下,当d=1, c= 时, 取 得最小值,这说明 是 的置信水平 1- 为最短置信区间。

6.5.3 单个正态总体参数的置信区间 一、 已知时 的置信区间 一、 已知时 的置信区间 在这种情况下,枢轴量可选为 ,c和d应满 足P(c≤G≤d)=(d)-(c)= 1-,经过不等式变形可得 该区间长度为 。当d=-c=u1-/2时,d-c达到最小 ,由此给出了的同等置信区间为 [ , ]。 (6.5.8) 这是一个以 为中心,半径为 的对称区间,常 将之表示为 。 【Za/2是标准正态分布上侧面积为a/2时的z值】

例6.5.3 用天平秤某物体的重量9次,得平均值为 (克),已知天平秤量结果为正态分布,其标准差为0.1克。试求该物体重量的0.95置信区间。 解:此处1- =0.95, =0.05,查表知u0.975=1.96,于是该物体重量 的0.95置信区间为 , 从而该物体重量的0.95置信区间为 [15.3347,15.4653]。

例6.5.4 设总体为正态分布N(,1),为得到 的置信 水平为0.95的置信区间长度不超过1.2,样本容量应为 多大? 解:由题设条件知 的0.95置信区间为 其区间长度为 ,它仅依赖于样本容量n而 与样本具体取值无关。现要求 ,立即有 n(2/1.2)2u21-/2.现1- = 0.95,故u1-/2=1.96,从而 n(5/3)2 1.962 = 10.6711。即样本容量至少为11时才能 使得 的置信水平为0.95的置信区间长度不超过1.2。

二、 2未知时 的置信区间 这时可用t 统计量,因为 ,因此 t 可以用来作为枢轴量。完全类似于上一小节,可得到 的1-置信区间为 二、 2未知时 的置信区间 这时可用t 统计量,因为 ,因此 t 可以用来作为枢轴量。完全类似于上一小节,可得到 的1-置信区间为 此处 是 2的无偏估计。

例6.5.5 假设轮胎的寿命服从正态分布。为估计某种轮胎的平均寿命,现随机地抽12只轮胎试用,测得它们的寿命(单位:万公里)如下: 4.68 4.85 4.32 4.85 4.61 5.02 5.20 4.60 4.58 4.72 4.38 4.70 此处正态总体标准差未知,可使用t分布求均值的置信区间。经计算有 =4.7092,s2=0.0615。取 =0.05,查表知t0.975(11)=2.2010,于是平均寿命的0.95置信区间为(单位:万公里)

在实际问题中,由于轮胎的寿命越长越好,因此 可以只求平均寿命的置信下限,也即构造单边的 置信下限。由于 由不等式变形可知 的1-置信下限为 将t0.95(11)=1.7959代入计算可得平均寿命 的0.95 置信下限为4.5806(万公里)。

取枢轴量 ,由于 2分布是偏态分布,寻找平均长度最短区间很难实现,一般都用等尾置信区间:采用 2的两个分位数 2 /2(n-1) 和21- /2(n-1),在 2分布两侧各截面积为/2的部分, 使得 由此给出 2的1-置信区间为

例6.5.6 某厂生产的零件重量服从正态分布N(, 2),现从该厂生产的零件中抽取9个,测得其重量为(单位:克) 45.3 45.4 45.1 45.3 45.5 45.7 45.4 45.3 45.6 试求总体标准差 的0.95置信区间。 解:由数据可算得 s2 =0.0325,(n-1)s2=80325=0.26. 查表知 2 0.025(8) =2.1797,20.975(8)=17.5345, 代入可得 2的0.95置信区间为 从而 的0.95置信区间为: [0.1218,0.3454]。

6.5.4 大样本置信区间 在样本容量充分大时,可以用渐近分布来 构造近似的置信区间。一个典型的例子是关 于比例p 的置信区间。

设x1,…, xn是来自b(1, p)的样本,有 对给定 , ,通过变形,可得到置信区间为 其中记= u21-/2,实用中通常略去/n项,于是可将置信区间近似为

例6.5.7 对某事件A作120次观察,A发生36次。试给 出事件A发生概率p 的0.95置信区间。 解:此处n=120, =36/120=0.3 而u0.975=1.96,于是p 的0.95(双侧)置信下限和上限分别为 故所求的置信区间为 [0.218,0.382]

例6.5.8 某传媒公司欲调查电视台某综艺节目收视 率p,为使得 p 的1-置信区间长度不超过d0,问 应调查多少用户? 解:这是关于二点分布比例p的置信区间问题,由(6.5.11)知,1-的置信区间长度为 这是一个随机变量,但由于 ,所以对任意的观测值有 。这也就是说p的1-的置信区间长度不会超过 。现要求p的的置信区间长度不超过d0,只需要 即可,从而 (6.5.12)

这是一类常见的寻求样本量的问题。比如,若 取d0=0.04, =0.05,则 这表明,要使综艺节目收视率p的0.95置信区 间的长度不超过0.04,则需要对2401个用户作 调查。

6.5.5 两个正态总体下的置信区间 设x1 , …, xm是来自N(1, 12)的样本,y1 , …, yn是来 自N(2, 22)的样本,且两个样本相互独立。 与 分别是它们的样本均值, 和 分别是它们的样本 方差。下面讨论两个均值差和两个方差比的置信 区间。

一、1 -2的置信区间 1、 12和 22已知时的两样本u区间 2、 12 = 22 = 2未知时的两样本t区间

3、 22 / 12=已知时的两样本t区间

4、当m和n都很大时的近似置信区间 5、一般情况下的近似置信区间 其中

例6.5.9 为比较两个小麦品种的产量,选择18块条 件相似的试验田,采用相同的耕作方法作试验, 结果播种甲品种的8块试验田的亩产量和播种乙 品种的10块试验田的亩产量(单位:千克/亩) 分别为: 甲品种 628 583 510 554 612 523 530 615 乙品种 535 433 398 470 567 480 498 560 503 426 假定亩产量均服从正态分布,试求这两个品种平 均亩产量差的置信区间.( =0.05)。

解:以x1 , …, x8记甲品种的亩产量,y1 , …, y10记乙 品种的亩产量,由样本数据可计算得到 =569.3750,sx2 =2140.5536,m=8 =487.0000,sy2=3256.2222, n=10 下面分两种情况讨论。

(1) 若已知两个品种亩产量的标准差相同,则可采 用两样本t区间。此处 故1 -2的0.95置信区间为

(2) 若两个品种亩产量的方差不等,则可采用近 似 t 区间。此处 s02 =2110.5536/8+3256.2222/10=589.4414, s0 =24.2784 于是1-2的0.95近似置信区间为 [31.3685,133.3815]

二、  12/ 22的置信区间 由于(m-1) sx2/ 12 2(m-1), (n-1) sy2/ 22 2(n-1),且sx2与sy2相互独立,故可仿照F变量构造如下枢 轴量 ,对给定的1-,由 经不等式变形即给出 12/ 22的如下的置信区间

例6.5.10 某车间有两台自动机床加工一类套筒,假设套筒直径服从正态分布。现在从两个班次的产品中分别检查了5个和6个套筒,得其直径数据如下(单位:厘米): 甲班:5.06 5.08 5.03 5.00 5.07 乙班:4.98 5.03 4.97 4.99 5.02 4.95 试求两班加工套筒直径的方差比 甲2/ 乙2的0.95置信区间。 解: 由数据算得sx2=0.00037, sx2=0.00092,故置信区间 [0.0544,3.7657]