Chp9:参数推断 主要内容 参数推断的基本概念 参数推断的方法 矩方法

Slides:



Advertisements
Similar presentations
高等数学( XJD ) 第二章 导数与微分 返回 高等数学( XAUAT ) 高等数学( XJD ) 求导法则 基本公式 导 数 导 数 微 分微 分 微 分微 分 求导方法 高阶导数 微分法则 导数与微分关系图导数与微分关系图.
Advertisements

目录 上页 下页 返回 结束 习题课 一、导数和微分的概念及应用 二、导数和微分的求法 导数与微分 第二章.
2.8 函数的微分 1 微分的定义 2 微分的几何意义 3 微分公式与微分运算法则 4 微分在近似计算中的应用.
第八章 第四节 机动 目录 上页 下页 返回 结束 一个方程所确定的隐函数 及其导数 隐函数的微分法.
2.6 隐函数微分法 第二章 第二章 二、高阶导数 一、隐式定义的函数 三、可微函数的有理幂. 一、隐函数的导数 若由方程 可确定 y 是 x 的函数, 由 表示的函数, 称为显函数. 例如, 可确定显函数 可确定 y 是 x 的函数, 但此隐函数不能显化. 函数为隐函数. 则称此 隐函数求导方法.
2.5 函数的微分 一、问题的提出 二、微分的定义 三、可微的条件 四、微分的几何意义 五、微分的求法 六、小结.
第二章 导数与微分 一. 内 容 要 点 二. 重 点 难 点 三. 主 要 内 容 四. 例 题与习题.
全微分 教学目的:全微分的有关概念和意义 教学重点:全微分的计算和应用 教学难点:全微分应用于近似计算.
2.3 函数的微分. 四川财经职业学院 课前复习 高阶导数的定义和计算方法。 作业解析:
第三节 微分 3.1 、微分的概念 3.2 、微分的计算 3.3 、微分的应用. 一、问题的提出 实例 : 正方形金属薄片受热后面积的改变量.
非线性时间序列模型 一般非线性时间序列模型介绍 条件异方差模型 上海财经大学 统计与管理学院.
Chp11:贝叶斯推断 内容: 贝叶斯观点和贝叶斯方法 贝叶斯推断 vs. 频率推断.
引言 我们已介绍了总体、样本、简单随机样本、统计量和抽样分布的概念,介绍了统计中常用的三大分布,给出了几个重要的抽样分布定理. 它们是进一步学习统计推断的基础.
第二部分:统计推断 Chp6:统计推断概述 Chp7:非参数推断 Chp8:Bootstrap Chp9:参数推断 Chp10:假设检验
圆的一般方程 (x-a)2 +(y-b)2=r2 x2+y2+Dx+Ey+F=0 Ax2+Bxy+Cy2+Dx+Ey+ F=0.
一、能线性化的多元非线性回归 二、多元多项式回归(线性化)
第三章 函数逼近 — 最佳平方逼近.
模式识别 – 概率密度函数的参数估计 第三章 概率密度函数的参 数估计. 模式识别 – 概率密度函数的参数估计 3.0 引言 贝叶斯分类器的学习:类条件概率密度函数的 估计。 问题的表示:已有 c 个类别的训练样本集合 D 1 , D 2 , … , D c ,求取每个类别的类条件概率密 度 。
例题 教学目的: 微积分基本公式 教学重点: 牛顿----莱布尼兹公式 教学难点: 变上限积分的性质与应用.
第五节 微积分基本公式 、变速直线运动中位置函数与速度 函数的联系 二、积分上限函数及其导数 三、牛顿—莱布尼茨公式.
第二节 微积分基本公式 1、问题的提出 2、积分上限函数及其导数 3、牛顿—莱布尼茨公式 4、小结.
第5章 定积分及其应用 基本要求 5.1 定积分的概念与性质 5.2 微积分基本公式 5.3 定积分的换元积分法与分部积分法
定积分习题课.
第三节 格林公式及其应用(2) 一、曲线积分与路径无关的定义 二、曲线积分与路径无关的条件 三、二元函数的全微分的求积 四、小结.
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
第二章 导数与微分 第二节 函数的微分法 一、导数的四则运算 二、复合函数的微分法.
全 微 分 欧阳顺湘 北京师范大学珠海分校
第三章 导数与微分 习 题 课 主要内容 典型例题.
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
Introduction To Mean Shift
第5章 §5.3 定积分的积分法 换元积分法 不定积分 分部积分法 换元积分法 定积分 分部积分法.
第三章 多维随机变量及其分布 §2 边缘分布 边缘分布函数 边缘分布律 边缘概率密度.
计算机数学基础 主讲老师: 邓辉文.
§2 求导法则 2.1 求导数的四则运算法则 下面分三部分加以证明, 并同时给出相应的推论和例题 .
EM算法 一种参数估计的方法.
Chp9:参数推断 本节课内容:计算似然的极大值 牛顿法 EM算法.
第4章 非线性规划 4.5 约束最优化方法 2019/4/6 山东大学 软件学院.
第一章 函数与极限.
习题 一、概率论 1.已知随机事件A,B,C满足 在下列三种情况下,计算 (1)A,B,C相互独立 (2)A,B独立,A,C互不相容
抽样和抽样分布 基本计算 Sampling & Sampling distribution
第二十二章 曲面积分 §1 第一型曲面积分 §2 第二型曲面积分 §3 高斯公式与斯托克斯公式.
模型分类问题 Presented by 刘婷婷 苏琬琳.
概 率 统 计 主讲教师 叶宏 山东大学数学院.
复习.
聚类 IRLAB.
第4章 Excel电子表格制作软件 4.4 函数(一).
第三单元 第2课 实验 一元函数的积分 实验目的:掌握matlab求解有关不定积分和定积分的问题,深入理解定积分的概念和几何意义。
正切函数的图象和性质 周期函数定义: 一般地,对于函数 (x),如果存在一个非零常数T,使得当x取定义域内的每一个值时,都有
定理21.9(可满足性定理)设A是P(Y)的协调子集,则存在P(Y)的解释域U和项解释,使得赋值函数v(A){1}。
§6.7 子空间的直和 一、直和的定义 二、直和的判定 三、多个子空间的直和.
3.1 变化率与导数   3.1.1 变化率问题 3.1.2 导数的概念.
概 率 统 计 主讲教师 叶宏 山东大学数学院.
第一节 不定积分的概念与性质 一、原函数与不定积分的概念 二、不定积分的几何意义 三、基本积分表 四、不定积分的性质 五、小结 思考题.
第三章 函数的微分学 第二节 导数的四则运算法则 一、导数的四则运算 二、偏导数的求法.
学习任务三 偏导数 结合一元函数的导数学习二元函数的偏导数是非常有用的. 要求了解二元函数的偏导数的定义, 掌握二元函数偏导数的计算.
第一部分:概率 产生随机样本:对分布采样 均匀分布 其他分布 伪随机数 很多统计软件包中都有此工具 如在Matlab中:rand
第15讲 特征值与特征向量的性质 主要内容:特征值与特征向量的性质.
数据统计与分析 秦 猛 南京大学物理系 第11讲 办公室:唐仲英楼A
§5.2 抽样分布   确定统计量的分布——抽样分布,是数理统计的基本问题之一.采用求随机向量的函数的分布的方法可得到抽样分布.由于样本容量一般不止2或 3(甚至还可能是随机的),故计算往往很复杂,有时还需要特殊技巧或特殊工具.   由于正态总体是最常见的总体,故本节介绍的几个抽样分布均对正态总体而言.
2019/5/20 第三节 高阶导数 1.
正弦、余弦函数的性质 华容一中 伍立华 2017年2月24日.
§2 方阵的特征值与特征向量.
难点:连续变量函数分布与二维连续变量分布
本节课内容 MLE的性质 MLE很流行是因为MLE有一些很好的性质.
第三节 函数的微分 3.1 微分的概念 3.2 微分的计算 3.3 微分的应用.
第四节 向量的乘积 一、两向量的数量积 二、两向量的向量积.
第三章 从概率分布函数的抽样 (Sampling from Probability Distribution Functions)
贝叶斯估计 Bayes Estimation
第四章 函数的 积分学 第七节 定积分的换元积分法     与分部积分法 一、定积分的换元积分法 二、定积分的分部积分法.
《偏微分方程》第一章 绪论 第一章 绪论 1.1.
Presentation transcript:

Chp9:参数推断 主要内容 参数推断的基本概念 参数推断的方法 矩方法 极大似然估计(Maximum Likelihood Estimator, MLE ) MLE的性质 卡-皮尔逊提出了使用矩来估计参数的方法。 Fisher则在1912年到1922年间提出了最大似然估计方法,基于直觉,提出了估计的一致性、有效性和充分性的概念。

参数推断 假设已知模型的函数形式 其中 为参数空间 目标: 估计参数 ,

例子 一些流行的参数模型的例子: 线性判别分别(LDA) (分类) 混合高斯模型 (密度估计) 高斯噪声模型 (回归)

参数估计 假设有一类模型函数 ,如所有的高斯函数的集合,其参数参数空间为 。 假设有一类模型函数 ,如所有的高斯函数的集合,其参数参数空间为 。 通常我们只对一些函数 感兴趣,如均值或均值的函数。因此 为感兴趣参数(parameter of interest), 为冗余参量(nuisance parameter)。 有多种方法可用来估计模型的参数 矩估计法 极大似然估计:更流行 贝叶斯方法

矩方法 矩方法得到的估计虽然不是最优的,但是很容易计算 可用作很多迭代算法的初始值 基本思想:矩匹配 当其他方法不可用时,可用矩方法 对真正的矩和样本矩进行匹配

矩方法 j阶矩: j阶样本矩: 矩方法:取前k阶矩 真正的矩 样本矩

例:Bernoulli分布 令 , 一阶矩 一阶样本矩 所以我们得到估计

例:高斯分布 令 ,参数为 , 一阶矩 一阶样本矩 二阶矩 二阶样本矩 所以

极大似然估计(MLE) 极大似然估计 似然函数 对似然函数求最大值 极大似然估计的性质

似然函数 令 为IID,其PDF为 ,似然函数定义为 有时也记为 或 ,表示似然函数为在给定x的情况下,参数θ的函数。 似然函数在数值上是数据的联合密度,但它是参数θ的函数, 。因此似然函数通常不满足密度函数的性质,如它对θ的积分不必为1。

似然的解释 若X是离散的,则 。如果我们比较两个参数θ1和θ2的似然值,如果 则观测到的样本更可能发生在θ = θ1下,也就是说,相比θ2 ,θ1是一个更可信的猜测。 对连续的X, 但通常我们并不将似然解释为参数θ的概率

极大似然估计 log似然函数定义为: ,它和似然函数在相同的位置取极大值。 极大似然估计(MLE) 是使得 最大的 ,即 log似然函数定义为: ,它和似然函数在相同的位置取极大值。 同样,相差常数倍也不影响似然函数取极大值的位置。因此似然函数中的常数项也可以抛弃。

例:Bernoulli分布 令 , 则概率函数 似然函数为 其中 所以 解方程

例:高斯分布 令 ,参数为 ,似然函数(忽略常数项)为 其中 为样本均值 为样本方差 因为

例:高斯分布 log似然函数为 解方程 得到 可以证明,这是似然函数的全局最大值。

对似然函数求最大值 对似然函数求极值(求导) 需注意的问题:要找到似然函数的全局极大值 解析法(如上例中的高斯模型) 数值计算:优化算法 如梯度下降法 如EM算法(如下例中的混合高斯模型) 需注意的问题:要找到似然函数的全局极大值 一阶导数为0只是必要条件,非充分条件 而且一阶导数为0只能找到函数定义域内部的局部极值点。如在边界上取极值,一阶导数可能不为0。因此还必须检验边界。

例:均匀分布 令 则概率函数 考虑一个固定的值,假设对于某一个i,有 ,则 因此令 则 所以 递减函数

混合高斯模型(GMM) (Mixture of Gaussians Model) 假设有K个成分 每个成分从均值为 、协方差矩阵为 的高斯分布产生数据 假设每个数据点根据如下规则产生: 随机选择一个成分,选择第k个成分的概率为 从第k个成分产生数据: 即

混合高斯模型 问题:给定IID数据 ,求参数 MLE不能解析求得,因此我们通过数值计算(如EM算法)求解。 将完整数据 转换为非完整数据/缺失数据 ,其中 为 所属的类别。

EM EM用于混合模型参数推断的具体过程请参见参考文献和参考ppt Matlab函数:ecmnmle 再下次课上讲述 [Mean, Covariance] = ecmnmle (Data, InitMethod, MaxIterations, Tolerance, Mean0, Covar0 )

EM for GMM 第t次的估计为 则第t+1次的估计为 E步 M步

EM总结 总结 参考文献 EM会收敛到局部极值,但不保证收敛到全局最优 适合的情况 缺失数据不太多时 数据维数不太高时(数据维数太高的话,E步的计算很费时) 参考文献 Jeff A. Bilmes, A Gentle Tutorial of the Algorithm and its Application to Parameter Estimation for Gaussian Mixture and Hidden Markov Models

下节课内容 MLE的性质