参数估计 参数估计问题:知道随机变量(总体)的分布类型, 但确切的形式不知道,根据样本来估计总体的参数,这 类问题称为参数估计。

Slides:



Advertisements
Similar presentations
第一章 、随机事件与概率 1.1 、随机事件 1.2 、随机事件的概率 1.3 、随机事件概率的计算 1.4 、伯努利概型.
Advertisements

第五节 函数的微分 一、微分的定义 二、微分的几何意义 三、基本初等函数的微分公式与微分运算 法则 四、微分形式不变性 五、微分在近似计算中的应用 六、小结.
2.8 函数的微分 1 微分的定义 2 微分的几何意义 3 微分公式与微分运算法则 4 微分在近似计算中的应用.
2.6 隐函数微分法 第二章 第二章 二、高阶导数 一、隐式定义的函数 三、可微函数的有理幂. 一、隐函数的导数 若由方程 可确定 y 是 x 的函数, 由 表示的函数, 称为显函数. 例如, 可确定显函数 可确定 y 是 x 的函数, 但此隐函数不能显化. 函数为隐函数. 则称此 隐函数求导方法.
概率统计与随机过程 宋 晖 – 2013年秋.
07/16/96 概率统计 自考辅导.
第一节 数理统计的基本概念.
第六章 样本及抽样分布 简单随机抽样: 代表性: 中每一个与所考察的总 体有相同的分布。 2.独立性: 是相互独立的随机变量。
引言 我们已介绍了总体、样本、简单随机样本、统计量和抽样分布的概念,介绍了统计中常用的三大分布,给出了几个重要的抽样分布定理. 它们是进一步学习统计推断的基础.
第三章 函数逼近 — 最佳平方逼近.
10.2 立方根.
6.6 单侧置信限 1、问题的引入 2、基本概念 3、典型例题 4、小结.
第五讲 抽样分布与参数估计.
08-09冬季学期 概率论与数理统计 姜旭峰,胡玉磊.
《高等数学》(理学) 常数项级数的概念 袁安锋
第四章 函数的积分学 第六节 微积分的基本公式 一、变上限定积分 二、微积分的基本公式.
主要内容 § 3.1 多维随机变量及联合分布 联合分布函里数 联合分布律 联合概率密度 § 3.2 二维随机变量的边缘分布
本讲义可在网址 或 ftp://math.shekou.com 下载
不确定度的传递与合成 间接测量结果不确定度的评估
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
区间估计 Interval Estimation.
第6章 统计量及其抽样分布 统计量 关于分布的几个概念 由正态分布导出的几个重要分布 样本均值的分布与中心极限定理 样本比例的抽样分布
第三章 多维随机变量及其分布 §2 边缘分布 边缘分布函数 边缘分布律 边缘概率密度.
例1 :甲击中的环数; X :乙击中的环数; Y 平较高? 试问哪一个人的射击水 : 的射击水平由下表给出 甲、乙两人射击,他们
本次课讲授:第二章第十一节,第十二节,第三章第一节, 下次课讲第三章第二节,第三节,第四节; 下次上课时交作业P29—P30
计算机数学基础 主讲老师: 邓辉文.
§2 求导法则 2.1 求导数的四则运算法则 下面分三部分加以证明, 并同时给出相应的推论和例题 .
第十章 方差分析.
第六章 数理统计的基本知识 第一节 总体与样本
数据统计与分析 秦 猛 南京大学物理系 手机: 第十讲 数据统计与分析 秦 猛 南京大学物理系 办公室:唐仲英楼A 手机:
概 率 统 计 主讲教师 叶宏 山东大学数学院.
连续型随机变量及其概率密度 一、概率密度的概念与性质 二、常见连续型随机变量的分布 三、小结.
第七章 参数估计 7.3 参数的区间估计.
第一章 函数与极限.
习题 一、概率论 1.已知随机事件A,B,C满足 在下列三种情况下,计算 (1)A,B,C相互独立 (2)A,B独立,A,C互不相容
抽样和抽样分布 基本计算 Sampling & Sampling distribution
实数与向量的积.
概 率 统 计 主讲教师 叶宏 山东大学数学院.
5.2 常用统计分布 一、常见分布 二、概率分布的分位数 三、小结.
复习.
第七章 参数估计 主讲教师:董庆宽 副教授 研究方向:密码学与信息安全
正切函数的图象和性质 周期函数定义: 一般地,对于函数 (x),如果存在一个非零常数T,使得当x取定义域内的每一个值时,都有
§6.7 子空间的直和 一、直和的定义 二、直和的判定 三、多个子空间的直和.
相关与回归 非确定关系 在宏观上存在关系,但并未精确到可以用函数关系来表达。青少年身高与年龄,体重与体表面积 非确定关系:
概 率 统 计 主讲教师 叶宏 山东大学数学院.
第三章 多维随机变量及其分布 第一节 二维随机变量 第二节 边缘分布 第三节 条件分布 第四节 相互独立的随机变量
第四节 随机变量函数的概率分布 X 是分布已知的随机变量,g ( · ) 是一个已知 的连续函数,如何求随机变量 Y =g(X ) 的分布?
第一部分:概率 产生随机样本:对分布采样 均匀分布 其他分布 伪随机数 很多统计软件包中都有此工具 如在Matlab中:rand
第15讲 特征值与特征向量的性质 主要内容:特征值与特征向量的性质.
数据统计与分析 秦 猛 南京大学物理系 第11讲 办公室:唐仲英楼A
§5.2 抽样分布   确定统计量的分布——抽样分布,是数理统计的基本问题之一.采用求随机向量的函数的分布的方法可得到抽样分布.由于样本容量一般不止2或 3(甚至还可能是随机的),故计算往往很复杂,有时还需要特殊技巧或特殊工具.   由于正态总体是最常见的总体,故本节介绍的几个抽样分布均对正态总体而言.
概率论与数理统计B.
第六章 参数估计 §6.1 点估计的几种方法 §6.2 点估计的评价标准 §6.3 最小方差无偏估计 §6.4 贝叶斯估计
正弦、余弦函数的性质 华容一中 伍立华 2017年2月24日.
§2 方阵的特征值与特征向量.
第二节 简单线性回归模型的最小二乘估计 用样本去估计总体回归函数,总要使用特定的方法,而任何估 计参数的方法都需要有一定的前提条件——假定条件 一、简单线性回归的基本假定 为什么要作基本假定? ●只有具备一定的假定条件,所作出的估计才具有良好的统计性质。 ●模型中有随机扰动项,估计的参数是随机变量,显然参数估计值的分布与扰动项的分布有关,只有对随机扰动的分布作出假定,才能比较方便地确定所估计参数的分布性质,也才可能进行假设检验和区间估计等统计推断。
第三节 随机区组设计的方差分析 随机区组设计资料的总平方和可以分解为三项: (10.10).
难点:连续变量函数分布与二维连续变量分布
数理统计基本知识.
第十五讲 区间估计 本次课讲完区间估计并开始讲授假设检验部分 下次课结束假设检验,并进行全书复习 本次课程后完成作业的后两部分
第三节 函数的微分 3.1 微分的概念 3.2 微分的计算 3.3 微分的应用.
第五章 数理统计的基本知识 §5.1 总体与样本.
第八章 假设检验 8.3 两个正态总体参数的假设检验.
数理统计部分 数理统计主要内容 第六章 样本及抽样分布 第七章 参数估计 第八章 假设检验
第三章 从概率分布函数的抽样 (Sampling from Probability Distribution Functions)
贝叶斯估计 Bayes Estimation
第四章 函数的 积分学 第七节 定积分的换元积分法     与分部积分法 一、定积分的换元积分法 二、定积分的分部积分法.
7.3 参数的区间估计 一、区间估计基本概念 二、正态总体均值与方差的区间估计 三、小结.
§2 自由代数 定义19.7:设X是集合,G是一个T-代数,为X到G的函数,若对每个T-代数A和X到A的函数,都存在唯一的G到A的同态映射,使得=,则称G(更严格的说是(G,))是生成集X上的自由T-代数。X中的元素称为生成元。 A变, 变 变, 也变 对给定的 和A,是唯一的.
Presentation transcript:

参数估计 参数估计问题:知道随机变量(总体)的分布类型, 但确切的形式不知道,根据样本来估计总体的参数,这 类问题称为参数估计。 参数估计的类型——点估计、区间估计

参数的估计量 设总体的分布函数为F(x,)(未知),X1,X2,…,Xn 为样本,构造一个统计量 来估计 为样本,构造一个统计量 来估计 参数,则称 为参数的估计量。 将样本观测值 代入 , 得到的值 称为参数的估计值。

点估计:如果构造一个统计量 来作为参数的估计量,则称为 参数的点估计。 区间估计:如果构造两个统计量 而用 来作为参数可能取值范围的估计,称为 参数的区间估计。

参数的点估计 点估计的方法 矩法、最大似然法 矩法估计 用样本的矩作为总体矩的估计量

(大数定律)若随机变量序列{Yn}独立同分布,且有相同的数学期望.则对于任意 > 0,恒有 设X1,X2,… , Xn为来自总体X的样本,则 总体的k阶原点矩 样本的k阶原点矩

总体的 阶原点矩,记作 样本的 阶原点矩,记作 得m个方程构成方程组,解得的 即为参数 的矩估计量,代入样本观测值,即得参数 的矩估计值。

注:也可以用样本的中心矩估计相应的总体中心矩 总体的 阶中心矩,记作 样本的 阶中心矩,记作 总体的k阶中心矩 样本的k阶中心矩

例1 对容量为n的样本,求下列密度函数中参数 的 矩估计量。 解 由于 所以由矩法估计,令 解得 所以,参数 的矩估计量为

例2 设X1,X2,…,Xn为总体X的样本,试求下列总体 分布参数的矩估计量。 解 (1)由于 所以参数和2的矩估计量为 (2)由于 令 得参数p的矩估计量为

例2 设X1,X2,…,Xn为总体X的样本,试求下列总体 分布参数的矩估计量。 (3)由于 所以参数的矩估计量为 或 可见:同一个参数的矩估计量可以不同。所以统计量 存在“优、劣”之分。

例3 设总体X服从[1, 2]上的均匀分布, 1<2,求 1, 2的矩估计量, X1,X2,…,Xn为X的一个样本。 解 由于 所以由矩法估计,令 解得

例4 设某总体X的数学期望为EX=a,方差DX=b,X1, X2,…,Xn为样本,试求a和b的矩估计量。 解 总体的1,2阶原点矩分别为 样本的2阶原点矩分别为 由矩法估计,令 所以

结论:不管总体X服从何种分布,总体期望和方差 的矩估计量分别为样本均值和 ,即 估计值为

假设在一个罐中放着许多白球和黑球,并假定已经知道两种球的数目之比是1:3,但不知道哪种颜色的球多。如果用放回抽样方法从罐中取5个球,观察结果为: 黑、白、黑、黑、白,估计黑球的概率p.

似然函数的定义

最大似然估计法

例5 解 似然函数

对数似然函数

例6 解

似然函数的定义

例7 解

例8 解 似然函数为

它们与相应的矩估计量相同.

例9 设某总体X的密度为 (X1,X2,…,Xn)为取自X的样本, 试求的矩估计量和最大似然估计量。 矩估计 的矩估计量

最大似然估计 的最大似然估计量

例10 设某总体X的分布律为 现得到样本观测值为2,3,2,1,3, 试求的矩估计量和最大似然估计量。 矩估计 的矩估计量

最大似然估计 的最大似然估计量

对于同一个参数,用不同的方法可以得到不同的估计量. 现在的问题是,当同一参数出现多个估计量时,究竟哪一个更好呢 对于同一个参数,用不同的方法可以得到不同的估计量. 现在的问题是,当同一参数出现多个估计量时,究竟哪一个更好呢? 这就涉及到用什么标准来评价估计量的问题. 确定估计量好坏的标准必须是整体性的,说得明确一点就是,必须在大量观察的基础上从统计的意义上来评价估计量的好坏.也就是说,估计的好坏取决于估计量的统计性质.一般认为,一个“好”的估计量应该具有如下的条件:

一、无偏性 估计量是随机变量, 对于不同的样本值就会得到不同的估计值, 希望估计值在未知参数真值左右徘徊, 最好它的数学期望等于未知参数的真值, 这就导致了无偏性这个标准。 定义

样本方差 样本均值 是EX的无偏估计, 样本方差 是DX的无偏估计。

样本二阶中心矩 如果 但, 则称 是 的渐近无偏估计量 不是DX的无偏估计, 但它是DX的渐近无偏估计.

例1 证 例2 证

二、有效性 一般来说,一个参数往往有多个无偏估计量. 若 有两个无偏估计量: , 则 当a+b=1时都是 的无偏估计量。 估计量的无偏性只保证了估计量的取值在参数真值周围波动,但是波动的幅度有多大呢?自然的, 我们希望估计量波动的幅度越小越好,幅度越小,则估计量取值与参数真值有较大偏差的可能性越小,而衡量随机变量波动幅度的量就是方差.这样就有了我们下面要介绍的有效性的概念.

定义 例3

三、相合性 定义 直观上看,当n增大时,样本信息增多,当然希望估计量越来越靠近真值的概率也越来越大, 这种想法就引出了上面的一致性概念. 一致估计量一般地是当样本容量很大时,才能显示其优点.

(大数定律)若随机变量序列{Yn}独立同分布,且有相同的数学期望.则对于任意 > 0,恒有 设X1,X2,… , Xn为来自总体X的样本,则

可以证明, 是DX的一致估计量。 样本均值是总体均值的相合(一致)估计. 样本方差是总体方差的相合(一致)估计.

引例 为了估计某厂生产的灯泡的平均使用寿命,现从中 随机抽取5只,测量其寿命如下:1455,1502,1370, 1610,1430,则该厂灯泡的平均使用寿命的点估计值为 可以认为该种灯泡的使用寿命在1473.4个单位时间左右, 但范围有多大呢?又有多大的可能性在这“左右”呢?

( ) 也就是说,我们希望确定一个(随机)区间,使我们能以比较高的可靠程度相信它包含真参数值. 真值 ( ) 这里所说的“可靠程度”是用概率来度量的 , 称为置信度或置信水平. 习惯上把置信水平记作 ,这里 是一个 很小的正数.

不同的置信水平,参数的置信区间不同.

要求 以很大的可能被包含在置信区间内,就是说 , 概率 要尽可能大,即要求估计尽量可靠.区间的长度反映了估计的精度. 区间估计中的精确性与可靠性是相互矛盾的.当样本容量一定时,提高估计的可靠度,将降低估计的精度;相反,提高估计的精度,将降低估计的可靠度.在实际使用中,总是在保证一定的可靠度的情况下尽可能地提高其精度.

区间估计的步骤

正态总体方差已知,对均值的区间估计 u/2  /2 -u/2 x (x) 如果总体X~N(,2),其中2已知,未知, 对给定的置信水平1-,对做区间估计。 取U-统计量 (x) O u/2  /2 -u/2 x 从而得的置信水平为1-的置信区间为

例1 某车间生产滚珠,从长期实践中知道,滚珠直径X 可以认为服从正态分布,从某天的产品中随机抽取6个, 测得直径为(单位:cm) 14.6,15.1,14.9,14.8,15.2,15.1 若已知方差为0.06,分别求在置信度为0.95和0.99的 平均直径EX的置信区间.

由题设知X~N(,0.06) EX的置信区间为 当=0.05时, 所以,EX的置信区间为(14.754,15.146) 当=0.01时, 所以,EX的置信区间为(14.692,15.208) 置信水平提高,置信区间扩大,估计精确度降低。

正态总体方差未知,对均值的区间估计 t/2 (n-1)  /2 - t/2(n-1) f(t) 如果总体X~N(,2),其中,均未知. 对给定的置信水平1-,对做区间估计 由 构造T-统计量 f(t) O t/2 (n-1)  /2 - t/2(n-1) 从而得的置信水平为1-的置信区间为

例2 某厂生产的一种塑料口杯的重量X被认为服从正态 分布,今随机抽取9个,测得其重量为(单位:克): 21.1,21.3,21.4,21.5,21.3,21.7,21.4,21.3, 21.6。试用95%的置信度估计全部口杯的平均重量。 解 由题设可知:口杯的重量X~N(,2) 由抽取的9个样本,可得 得 由 查表得 全部口杯的平均重量的置信区间为(21.26,21.54)

例3 随机从一批钉子中抽取6枚钉子,测得长度分别为 2.14, 2.10, 2.15,2.10,2.13,2.12 (单位:厘米) 并设总体X~N(,2),求下列两种情况下的置信度 为90%的置信区间. (1) 2 =0.01; (2) 2未知 (1)的置信度为90%的置信区间为(2.056,2.190). (2)的置信度为90%的置信区间为(2.106,2.140).

正态总体均值已知,对方差的区间估计 x f(x) 如果总体X~N(,2),其中已知,2未知 对给定的置信水平1-,对2做区间估计 由 f(x) x O 构造2-统计量 从而得2的置信水平为1-的置信区间为

例4 已知某种果树产量服从N(218,2),随机 抽取6棵计算其产量为(单位:kg) 221,191,202,205,256,236 试以95%的置信水平估计产量的方差。 解 计算 果树方差的置信区间为

正态总体均值未知,对方差的区间估计 x f(x) 如果总体X~N(,2),其中, ,2未知 对给定的置信水平1-,对2做区间估计 构造2-统计量 f(x) x O 从而得2的置信水平为1-的置信区间为

例5 设某灯泡的寿命X~N(,2), ,2未知,现 从中任取5个灯泡进行寿命试验,得数据10.5,11.0, 11.2,12.5,12.8(单位:千小时),求置信水平为 90%的2的区间估计。 解 样本方差及均值分别为 由 得 查表得 2的置信水平为90%的置信区间为(0.4195,5.5977)

正态分布总体对均值的区间估计 (1)方差已知,对均值的区间估计 (2)方差未知,对均值的区间估计

正态分布总体对方差的区间估计 (3)均值已知,对方差的区间估计 (4)均值未知,对方差的区间估计