数据统计与分析 秦 猛 南京大学物理系 第11讲 办公室:唐仲英楼A

Slides:



Advertisements
Similar presentations
第一章 、随机事件与概率 1.1 、随机事件 1.2 、随机事件的概率 1.3 、随机事件概率的计算 1.4 、伯努利概型.
Advertisements

目录 上页 下页 返回 结束 习题课 一、导数和微分的概念及应用 二、导数和微分的求法 导数与微分 第二章.
2.8 函数的微分 1 微分的定义 2 微分的几何意义 3 微分公式与微分运算法则 4 微分在近似计算中的应用.
第八章 第四节 机动 目录 上页 下页 返回 结束 一个方程所确定的隐函数 及其导数 隐函数的微分法.
2.6 隐函数微分法 第二章 第二章 二、高阶导数 一、隐式定义的函数 三、可微函数的有理幂. 一、隐函数的导数 若由方程 可确定 y 是 x 的函数, 由 表示的函数, 称为显函数. 例如, 可确定显函数 可确定 y 是 x 的函数, 但此隐函数不能显化. 函数为隐函数. 则称此 隐函数求导方法.
5.4 微 分 一、微分概念 二、微分的运算法则与公式 三、微分在近似计算上的应用. 引例 一块正方形金属片受热后其边长 x 由 x 0 变到 x 0  x  考查此薄片的面积 A 的改变情况  因为 A  x 2  所以金属片面 积的改变量为  A  (x 0 
2.5 函数的微分 一、问题的提出 二、微分的定义 三、可微的条件 四、微分的几何意义 五、微分的求法 六、小结.
第二章 导数与微分. 二、 微分的几何意义 三、微分在近似计算中的应用 一、 微分的定义 2.3 微 分.
全微分 教学目的:全微分的有关概念和意义 教学重点:全微分的计算和应用 教学难点:全微分应用于近似计算.
07/16/96 概率统计 自考辅导.
引言 我们已介绍了总体、样本、简单随机样本、统计量和抽样分布的概念,介绍了统计中常用的三大分布,给出了几个重要的抽样分布定理. 它们是进一步学习统计推断的基础.
第三章 函数逼近 — 最佳平方逼近.
6.6 单侧置信限 1、问题的引入 2、基本概念 3、典型例题 4、小结.
概率论与 数理统计 高教自考复习 总第十四讲.
08-09冬季学期 概率论与数理统计 姜旭峰,胡玉磊.
第二节 微积分基本定理 一、积分上限函数及其导数 二、积分上限函数求导法则 三、微积分基本公式.
第四章 函数的积分学 第六节 微积分的基本公式 一、变上限定积分 二、微积分的基本公式.
第5章 定积分及其应用 基本要求 5.1 定积分的概念与性质 5.2 微积分基本公式 5.3 定积分的换元积分法与分部积分法
主要内容 § 3.1 多维随机变量及联合分布 联合分布函里数 联合分布律 联合概率密度 § 3.2 二维随机变量的边缘分布
本讲义可在网址 或 ftp://math.shekou.com 下载
第三节 函数的求导法则 一 函数的四则运算的微分法则 二 反函数的微分法则 三 复合函数的微分法则及微分 形式不变性 四 微分法小结.
第三节 格林公式及其应用(2) 一、曲线积分与路径无关的定义 二、曲线积分与路径无关的条件 三、二元函数的全微分的求积 四、小结.
第二章 导数与微分 第二节 函数的微分法 一、导数的四则运算 二、复合函数的微分法.
2-7、函数的微分 教学要求 教学要点.
Introduction To Mean Shift
第5章 §5.3 定积分的积分法 换元积分法 不定积分 分部积分法 换元积分法 定积分 分部积分法.
第三章 多维随机变量及其分布 §2 边缘分布 边缘分布函数 边缘分布律 边缘概率密度.
本次课讲授:第二章第十一节,第十二节,第三章第一节, 下次课讲第三章第二节,第三节,第四节; 下次上课时交作业P29—P30
计算机数学基础 主讲老师: 邓辉文.
§2 求导法则 2.1 求导数的四则运算法则 下面分三部分加以证明, 并同时给出相应的推论和例题 .
EM算法 一种参数估计的方法.
第一章 函数 函数 — 研究对象—第一章 分析基础 极限 — 研究方法—第二章 连续 — 研究桥梁—第二章.
第六章 数理统计的基本知识 第一节 总体与样本
数据统计与分析 秦 猛 南京大学物理系 手机: 第十讲 数据统计与分析 秦 猛 南京大学物理系 办公室:唐仲英楼A 手机:
第四模块 函数的积分学 第三节 第二类换元积分法.
概 率 统 计 主讲教师 叶宏 山东大学数学院.
第八模块 复变函数 第二节 复变函数的极限与连续性 一、复变函数的概念 二、复变函数的极限 二、复变函数的连续性.
第七章 参数估计 7.3 参数的区间估计.
第一章 函数与极限.
习题 一、概率论 1.已知随机事件A,B,C满足 在下列三种情况下,计算 (1)A,B,C相互独立 (2)A,B独立,A,C互不相容
抽样和抽样分布 基本计算 Sampling & Sampling distribution
概 率 统 计 主讲教师 叶宏 山东大学数学院.
5.2 常用统计分布 一、常见分布 二、概率分布的分位数 三、小结.
第七章 参数估计 主讲教师:董庆宽 副教授 研究方向:密码学与信息安全
第16讲 相似矩阵与方阵的对角化 主要内容: 1.相似矩阵 2. 方阵的对角化.
§6.7 子空间的直和 一、直和的定义 二、直和的判定 三、多个子空间的直和.
概 率 统 计 主讲教师 叶宏 山东大学数学院.
第三章 函数的微分学 第二节 导数的四则运算法则 一、导数的四则运算 二、偏导数的求法.
4) 若A可逆,则 也可逆, 证明: 所以.
学习任务三 偏导数 结合一元函数的导数学习二元函数的偏导数是非常有用的. 要求了解二元函数的偏导数的定义, 掌握二元函数偏导数的计算.
第三章 多维随机变量及其分布 第一节 二维随机变量 第二节 边缘分布 第三节 条件分布 第四节 相互独立的随机变量
第四节 随机变量函数的概率分布 X 是分布已知的随机变量,g ( · ) 是一个已知 的连续函数,如何求随机变量 Y =g(X ) 的分布?
第一部分:概率 产生随机样本:对分布采样 均匀分布 其他分布 伪随机数 很多统计软件包中都有此工具 如在Matlab中:rand
第15讲 特征值与特征向量的性质 主要内容:特征值与特征向量的性质.
§5.2 抽样分布   确定统计量的分布——抽样分布,是数理统计的基本问题之一.采用求随机向量的函数的分布的方法可得到抽样分布.由于样本容量一般不止2或 3(甚至还可能是随机的),故计算往往很复杂,有时还需要特殊技巧或特殊工具.   由于正态总体是最常见的总体,故本节介绍的几个抽样分布均对正态总体而言.
概率论与数理统计B.
正弦、余弦函数的性质 华容一中 伍立华 2017年2月24日.
§2 方阵的特征值与特征向量.
难点:连续变量函数分布与二维连续变量分布
数理统计基本知识.
第十五讲 区间估计 本次课讲完区间估计并开始讲授假设检验部分 下次课结束假设检验,并进行全书复习 本次课程后完成作业的后两部分
第八章 假设检验 8.3 两个正态总体参数的假设检验.
参数估计 参数估计问题:知道随机变量(总体)的分布类型, 但确切的形式不知道,根据样本来估计总体的参数,这 类问题称为参数估计。
定义5 把矩阵 A 的行换成同序数的列得到的矩阵,
第四节 向量的乘积 一、两向量的数量积 二、两向量的向量积.
第三章 从概率分布函数的抽样 (Sampling from Probability Distribution Functions)
贝叶斯估计 Bayes Estimation
用向量法推断 线面位置关系.
第四章 函数的 积分学 第七节 定积分的换元积分法     与分部积分法 一、定积分的换元积分法 二、定积分的分部积分法.
三角 三角 三角 函数 余弦函数的图象和性质.
Presentation transcript:

数据统计与分析 秦 猛 南京大学物理系 第11讲 qinmeng@nju.edu.cn 办公室:唐仲英楼A508 83688960 手机:13913939339 参考教材:《概率论与数理统计》 高新祖 陈华钧 编著 南京大学出版社 1 1

7-2 点 估 计 统计 推断 DE 基本 问题 参数估 计问题 区间估 计 假设检 验问题

什么是参数估计? 参数是刻画总体某方面概率特性的数量. 当此数量未知时,从总体抽出一个样本, 用某种方法对这个未知参数进行估计就 是参数估计. 例如,X ~N ( , 2), 若,  2未知, 通过构造样本的函数, 给出 它们的估计值或取值范围就是参数估计 的内容. 点估计 区间估计

参数估计的类型 点估计 —— 估计未知参数的值 区间估计—— 估计未知参数的取值范围, 并使此范围包含未知参数 真值的概率为给定的值.

§7.1 点估计方法 点估计的思想方法 设总体X 的分布函数的形式已知, 但含有一个或多个未知参数:1,2, ,k 7-5 §7.1 点估计方法 点估计的思想方法 设总体X 的分布函数的形式已知, 但含有一个或多个未知参数:1,2, ,k 设 X1, X2,…, Xn为总体的一个样本 构造 k 个统计量: 随机变量

并建立k个方程。 当测得样本值(x1, x2,…, xn)时,代入上述 方程组,即可得到 k 个数: 称数 为未知参数 的估计值 对应统计量 7-6 并建立k个方程。 当测得样本值(x1, x2,…, xn)时,代入上述 方程组,即可得到 k 个数: 数 值 称数 为未知参数 的估计值 对应统计量 为未知参数 的估计量

7-7 三种常用的点估计方法 频率替换法 利用事件A 在 n 次试验中发生的频率 作为事件A 发生的概率 p 的估计量

例1 设总体X ~ N (  , 2 ), 在对其作28 次 独立观察中, 事件 “X < 4” 出现了21 次, 试 7-8 例1 设总体X ~ N (  , 2 ), 在对其作28 次 独立观察中, 事件 “X < 4” 出现了21 次, 试 用频率替换法求参数  的估计值. 解 由 查表得 于是  的估计值为

用样本 k 阶矩作为总体 k 阶矩的估计量, 建立含有待估参数的方程, 从而解出待估参数 7-9 矩法 用样本 k 阶矩作为总体 k 阶矩的估计量, 建立含有待估参数的方程, 从而解出待估参数 方法 一般, 不论总体服从什么分布, 总体期望  与方差 2 存在, 则它们的矩估计量分别为

7-10 事实上,按矩法原理,令

设待估计的参数为 设总体的 r 阶矩存在,记为 样本 X1, X2,…, Xn 的 r 阶矩为 令 7-11 设待估计的参数为 设总体的 r 阶矩存在,记为 样本 X1, X2,…, Xn 的 r 阶矩为 令 —— 含未知参数 1,2, ,k 的方程组

解方程组 , 得 k 个统计量: 未知参数 1, ,k 的矩估计量 代入一组样本值得 k 个数: 未知参数 1, ,k 7-12 解方程组 , 得 k 个统计量: 未知参数 1, ,k 的矩估计量 代入一组样本值得 k 个数: 未知参数 1, ,k 的矩估计值

例2 设总体 X ~ N (  , 2 ), X1, X2,…, Xn为 总体的样本, 求  , 2 的矩法估计量. 解 7-13 例2 设总体 X ~ N (  , 2 ), X1, X2,…, Xn为 总体的样本, 求  , 2 的矩法估计量. 解 例3 设总体 X ~ E(), X1, X2,…, Xn为总体的 样本, 求 的矩法估计量. 解 令 故

例4 设从某灯泡厂某天生产的灯泡中随机 抽取10只灯泡,测得其寿命为(单位:小时) 1050, 1100, 1080, 1120, 1200 7-14 例4 设从某灯泡厂某天生产的灯泡中随机 抽取10只灯泡,测得其寿命为(单位:小时) 1050, 1100, 1080, 1120, 1200 1250, 1040, 1130, 1300, 1200 试用矩法估计该厂这天生产的灯泡的平均 寿命及寿命分布的方差. 解

7-15 例5 设总体 X ~ U (a, b), a, b 未知, 求参数 a, b 的 矩法估计量. 解 由于 令

7-16 解得

极大似然估计法 思想方法:一次试验就出现的 事件有较大的概率 例如: 有两外形相同的箱子,各装100个球 一箱 99个白球 1 个红球 7-17 极大似然估计法 思想方法:一次试验就出现的 事件有较大的概率 例如: 有两外形相同的箱子,各装100个球 一箱 99个白球 1 个红球 一箱 1 个白球 99个红球 现从两箱中任取一箱, 并从箱中任取一球, 结果所取得的球是白球. 问: 所取的球来自哪一箱? 答: 第一箱.

例6 设总体 X 服从0-1分布,且P (X = 1) = p, 用极大似然法求 p 的估计值. 解 总体 X 的概率分布为 7-18 例6 设总体 X 服从0-1分布,且P (X = 1) = p, 用极大似然法求 p 的估计值. 解 总体 X 的概率分布为 设 x1, x2,…, xn为总体样本X1, X2,…, Xn 的样本值, 则

7-19 对于不同的 p , L (p)不同, 见右下图 发生了, 事件 现经过一次试验, 则 p 的取值应使这个事件发生 的概率最大.

注意到,ln L(p)是 L 的单调增函数,故若 某个p 使ln L(p)最大, 则这个p 必使L(p)最大。 7-20 在容许范围内选择 p ,使L(p)最大 注意到,ln L(p)是 L 的单调增函数,故若 某个p 使ln L(p)最大, 则这个p 必使L(p)最大。 所以 为所求 p 的估计值.

7-21 一般, 设 X 为离散型随机变量, 其分布律为 则样本 X1, X2,…, Xn的概率分布为 或 称 L( ) 为样本的似然函数

极大似然法的思想 选择适当的 = ,使 取最大值, 即 L( ) 称这样得到的 为参数  的极大似然估计值 mle 简记 称统计量 7-22 极大似然法的思想 选择适当的 = ,使 取最大值, 即 L( ) 称这样得到的 为参数  的极大似然估计值 mle 简记 称统计量 MLE 简记 为参数  的极大似然估计量

若 X 连续, 取 f (xi, )为Xi 的密度函数 注1 似然函数为 未知参数可以不止一个, 如1,…, k 注2 7-23 若 X 连续, 取 f (xi, )为Xi 的密度函数 注1 似然函数为 未知参数可以不止一个, 如1,…, k 注2 设X 的密度(或分布)为 则定义似然函数为

若 关于1, …, k可微,则称 为似然方程组 若对于某组给定的样本值 x1, x2,…, xn, 参数 使似然函数取得最大值, 即 7-24 若 关于1, …, k可微,则称 为似然方程组 若对于某组给定的样本值 x1, x2,…, xn, 参数 使似然函数取得最大值, 即 则称 为1,…, k 的极大似然估计值

7-25 显然, 称统计量 为1, 2,…, k 的极大似然估计量

7-26 例7 设总体 X ~ N (, 2), x1, x2,…, xn 是 X 的样本值, 求 ,  2 的极大似然估计. 解

7-27 似然 方程 组为 ,  2 的极大似然估计量分别为

7-28 极大似然估计方法 1) 写出似然函数 L 2)求出 , 使得

若 L是 的可微函数,解似然方程组 可得未知参数的极大似然估计值 然后, 再求得极大似然估计量. L不是 的可微函数, 需用其它 若 7-29 若 L是 的可微函数,解似然方程组 可得未知参数的极大似然估计值 然后, 再求得极大似然估计量. L不是 的可微函数, 需用其它 方法求极大似然估计值. 请看下例: 若

例8 设 X ~ U (a,b), x1, x2,…, xn 是 X 的一个 样本值, 求 a , b 的极大似然估计值与极大 似然估计量. 7-30 例8 设 X ~ U (a,b), x1, x2,…, xn 是 X 的一个 样本值, 求 a , b 的极大似然估计值与极大 似然估计量. 解 X 的密度函数为 似然函数为

xmin = min {x1, x2,…, xn} xmax = max {x1, x2,…, xn} 7-31 似然函数只有当 a < xi < b, i = 1,2,…, n 时 才能获得最大值, 且 a 越大, b 越小, L 越大. 令 xmin = min {x1, x2,…, xn} xmax = max {x1, x2,…, xn} 取 则对满足 的一切 a < b , 都有

问 题 故 是 a , b 的极大似然估计值. 分别是 a , b 的极大似然估计量. 1) 待估参数的极大似然估计是否一定存在? 7-32 故 是 a , b 的极大似然估计值. 分别是 a , b 的极大似然估计量. 问 题 1) 待估参数的极大似然估计是否一定存在? 2) 若存在, 是否惟一?

例9 设 X ~ U ( a – ½, a + ½), x1, x2,…, xn 是 X的一个样本, 求 a 的极大似然估计值. 解 7-33 例9 设 X ~ U ( a – ½, a + ½), x1, x2,…, xn 是 X的一个样本, 求 a 的极大似然估计值. 解 由上例可知, 当 时, L 取最大值 1, 即 显然, a 的极大似然估计值可能不存在, 也 可能不惟一.

7-34 不仅如此, 任何一个统计量 若满足 都可以作为 a 的估计量.

极大似然估计的不变性 设 是 的极大似然估计值, u( ) (   )是 的函数, 且有单值反函数  =  (u), uU 7-35 极大似然估计的不变性 设 是 的极大似然估计值, u( ) (   )是 的函数, 且有单值反函数  =  (u), uU 则 是 u( ) 的极大似然估计值.

如 在正态总体N (, 2)中,  2的极大 似然估计值为 是 2的单值函数, 且具有单值 反函数,故 的极大似然估计值为 7-36 如 在正态总体N (, 2)中,  2的极大 似然估计值为 是 2的单值函数, 且具有单值 反函数,故 的极大似然估计值为 lg 的极大似然估计值为