EM算法 一种参数估计的方法.

Slides:



Advertisements
Similar presentations
高等数学( XJD ) 第二章 导数与微分 返回 高等数学( XAUAT ) 高等数学( XJD ) 求导法则 基本公式 导 数 导 数 微 分微 分 微 分微 分 求导方法 高阶导数 微分法则 导数与微分关系图导数与微分关系图.
Advertisements

一、 一阶线性微分方程及其解法 二、 一阶线性微分方程的简单应用 三、 小结及作业 §6.2 一阶线性微分方程.
第五节 函数的微分 一、微分的定义 二、微分的几何意义 三、基本初等函数的微分公式与微分运算 法则 四、微分形式不变性 五、微分在近似计算中的应用 六、小结.
第二章 导数与微分 习题课 主要内容 典型例题 测验题. 求 导 法 则求 导 法 则 求 导 法 则求 导 法 则 基本公式 导 数 导 数 微 分微 分 微 分微 分 高阶导数 高阶微分 一、主要内容.
目录 上页 下页 返回 结束 习题课 一、导数和微分的概念及应用 二、导数和微分的求法 导数与微分 第二章.
2.8 函数的微分 1 微分的定义 2 微分的几何意义 3 微分公式与微分运算法则 4 微分在近似计算中的应用.
第八章 第四节 机动 目录 上页 下页 返回 结束 一个方程所确定的隐函数 及其导数 隐函数的微分法.
2.6 隐函数微分法 第二章 第二章 二、高阶导数 一、隐式定义的函数 三、可微函数的有理幂. 一、隐函数的导数 若由方程 可确定 y 是 x 的函数, 由 表示的函数, 称为显函数. 例如, 可确定显函数 可确定 y 是 x 的函数, 但此隐函数不能显化. 函数为隐函数. 则称此 隐函数求导方法.
2.5 函数的微分 一、问题的提出 二、微分的定义 三、可微的条件 四、微分的几何意义 五、微分的求法 六、小结.
阻塞操作. 在 linux 里,一个等待队列由一个 wait_queue_head_t 类型的结构来描述 等待队列的初始化: static wait_queue_head_t testqueue; init_waitqueue_head(&testqueue);
非线性时间序列模型 一般非线性时间序列模型介绍 条件异方差模型 上海财经大学 统计与管理学院.
引言 我们已介绍了总体、样本、简单随机样本、统计量和抽样分布的概念,介绍了统计中常用的三大分布,给出了几个重要的抽样分布定理. 它们是进一步学习统计推断的基础.
一、能线性化的多元非线性回归 二、多元多项式回归(线性化)
第三章 函数逼近 — 最佳平方逼近.
6.6 单侧置信限 1、问题的引入 2、基本概念 3、典型例题 4、小结.
2016中重卡网络规划 中重卡营销部 2016年6月.
模式识别 – 概率密度函数的参数估计 第三章 概率密度函数的参 数估计. 模式识别 – 概率密度函数的参数估计 3.0 引言 贝叶斯分类器的学习:类条件概率密度函数的 估计。 问题的表示:已有 c 个类别的训练样本集合 D 1 , D 2 , … , D c ,求取每个类别的类条件概率密 度 。
例题 教学目的: 微积分基本公式 教学重点: 牛顿----莱布尼兹公式 教学难点: 变上限积分的性质与应用.
第五节 微积分基本公式 、变速直线运动中位置函数与速度 函数的联系 二、积分上限函数及其导数 三、牛顿—莱布尼茨公式.
第5章 定积分及其应用 基本要求 5.1 定积分的概念与性质 5.2 微积分基本公式 5.3 定积分的换元积分法与分部积分法
主要内容 § 3.1 多维随机变量及联合分布 联合分布函里数 联合分布律 联合概率密度 § 3.2 二维随机变量的边缘分布
不确定度的传递与合成 间接测量结果不确定度的评估
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
第三章 导数与微分 习 题 课 主要内容 典型例题.
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
Introduction To Mean Shift
第5章 §5.3 定积分的积分法 换元积分法 不定积分 分部积分法 换元积分法 定积分 分部积分法.
第三章 多维随机变量及其分布 §2 边缘分布 边缘分布函数 边缘分布律 边缘概率密度.
例1 :甲击中的环数; X :乙击中的环数; Y 平较高? 试问哪一个人的射击水 : 的射击水平由下表给出 甲、乙两人射击,他们
第三章:统计信号估计 3.1 问题描述 3.2 随机参量的Bayes估计 3.3 ML估计 3.4 估计量的性质
本次课讲授:第二章第十一节,第十二节,第三章第一节, 下次课讲第三章第二节,第三节,第四节; 下次上课时交作业P29—P30
§2 求导法则 2.1 求导数的四则运算法则 下面分三部分加以证明, 并同时给出相应的推论和例题 .
Chp9:参数推断 本节课内容:计算似然的极大值 牛顿法 EM算法.
Online job scheduling in Distributed Machine Learning Clusters
第一章 函数 函数 — 研究对象—第一章 分析基础 极限 — 研究方法—第二章 连续 — 研究桥梁—第二章.
连续型随机变量及其概率密度 一、概率密度的概念与性质 二、常见连续型随机变量的分布 三、小结.
第七章 参数估计 7.3 参数的区间估计.
第4章 非线性规划 4.5 约束最优化方法 2019/4/6 山东大学 软件学院.
习题 一、概率论 1.已知随机事件A,B,C满足 在下列三种情况下,计算 (1)A,B,C相互独立 (2)A,B独立,A,C互不相容
基于EM的MRF彩色图像分割 李求旭.
C++语言程序设计 C++语言程序设计 第七章 类与对象 第十一组 C++语言程序设计.
抽样和抽样分布 基本计算 Sampling & Sampling distribution
Chapter 8 Model Inference and Averaging
第二十二章 曲面积分 §1 第一型曲面积分 §2 第二型曲面积分 §3 高斯公式与斯托克斯公式.
Chp9:参数推断 主要内容 参数推断的基本概念 参数推断的方法 矩方法
模型分类问题 Presented by 刘婷婷 苏琬琳.
线性规 Linear Programming
概 率 统 计 主讲教师 叶宏 山东大学数学院.
第四章 一次函数 4. 一次函数的应用(第1课时).
5.2 常用统计分布 一、常见分布 二、概率分布的分位数 三、小结.
聚类 IRLAB.
第一部分:概率 对应教材Chp1-5 课堂上讲述会较快,将知识点串起来,建议大家通读教材 主要内容: 随机变量及其分布
第三章 从概率分布函数的抽样 (Sampling from Probability Distribution Functions)
概 率 统 计 主讲教师 叶宏 山东大学数学院.
第三章 函数的微分学 第二节 导数的四则运算法则 一、导数的四则运算 二、偏导数的求法.
多层循环 Private Sub Command1_Click() Dim i As Integer, j As Integer
学习任务三 偏导数 结合一元函数的导数学习二元函数的偏导数是非常有用的. 要求了解二元函数的偏导数的定义, 掌握二元函数偏导数的计算.
第三章 多维随机变量及其分布 第一节 二维随机变量 第二节 边缘分布 第三节 条件分布 第四节 相互独立的随机变量
第四节 随机变量函数的概率分布 X 是分布已知的随机变量,g ( · ) 是一个已知 的连续函数,如何求随机变量 Y =g(X ) 的分布?
第一部分:概率 产生随机样本:对分布采样 均匀分布 其他分布 伪随机数 很多统计软件包中都有此工具 如在Matlab中:rand
第15讲 特征值与特征向量的性质 主要内容:特征值与特征向量的性质.
数据统计与分析 秦 猛 南京大学物理系 第11讲 办公室:唐仲英楼A
§5.2 抽样分布   确定统计量的分布——抽样分布,是数理统计的基本问题之一.采用求随机向量的函数的分布的方法可得到抽样分布.由于样本容量一般不止2或 3(甚至还可能是随机的),故计算往往很复杂,有时还需要特殊技巧或特殊工具.   由于正态总体是最常见的总体,故本节介绍的几个抽样分布均对正态总体而言.
概率论与数理统计B.
第二节 函数的极限 一、函数极限的定义 二、函数极限的性质 三、小结 思考题.
难点:连续变量函数分布与二维连续变量分布
本节课内容 MLE的性质 MLE很流行是因为MLE有一些很好的性质.
第三章 从概率分布函数的抽样 (Sampling from Probability Distribution Functions)
贝叶斯估计 Bayes Estimation
聚类工具 聚类 分类 聚类分析起源于分类学,但是聚类不等于分类。聚类与分类的不同在于,聚类所要求划分的类是未知的。
Presentation transcript:

EM算法 一种参数估计的方法

提纲 高斯混合模型 EM算法的思想 EM算法的应用 总结 参考文献

高斯混合模型 混合模型(Mixed Model): 其中 ,满足 即混合模型由K个成分组成,每个成分 的权重为 其中 ,满足 即混合模型由K个成分组成,每个成分 的权重为 若混合模型中每个成分为高斯分布, 则为高斯混合模型(Gaussian Mixture Model)

GMM的例子 例1:一个班级每个学生的身高为 假设男生和女生的身高分别服从高斯分布 则 其中 为男生的比例, 问题:给定独立同分布(independent and identically distributed----IID)的数据 ,求参数 混合模型的参数估计是EM(Expectation Maximization)算法最典型的应用

GMM的例子 例2: 分布的随机数的直方图 n = 10000; z = zeros(1,n); pw1 = 0.6; u1 = -2; 例2: 分布的随机数的直方图 n = 10000; z = zeros(1,n); pw1 = 0.6; u1 = -2; std1 = 2; pw2 = 0.4; u2 = 3; std2 = 1; y1 = randn(1,floor(n*pw1))*std1 + u1; y2 = randn(1,floor(n*pw2))*std2 + u2; z(1,1:floor(n*pw1)) =y1; z(1,(floor(n*pw1)+1):n) = y2;

提纲 高斯混合模型 EM算法的思想 EM算法的应用 总结 参考文献

极大似然估计与EM算法的关系 计算极大似然估计(maximum likelihood estimate,MLE),需要求似然函数的极值 值计算:如高斯混合模型 EM算法

极大似然估计(MLE) 独立同分布(IID)的数据 其概率密度函数为 似然函数定义为 log似然函数定义为 的极大似然估计为

完整数据 观测数据:观测到的随机变量 的IID样本 缺失数据:未观测到的随机变量 的值 在GMM中,若 来自第k个成分,则 缺失数据:未观测到的随机变量 的值 在GMM中,若 来自第k个成分,则 完整数据:包含观测到的随机变量 和未观测到的随机变量 的数据,

完整似然函数 若隐含变量 的值已知,得到完整数据的log似然函数为:

EM—Expectation 观测数据X已知,参数的当前值 已知,在完整似然函数中,缺失数据(隐含变量) Y未知,完整log似然函数对Y求期望。 定义 其中 是待确定的参数 通过求期望,去掉了完整似然函数中的变量Y。即EM的E步。

EM—Maximization 对E步计算得到的完整似然函数的期望求极大值(EM的M步),得到参数新的估计值,即 每次参数更新会增加非完整似然值 反复迭代后,会收敛到似然的局部最大值

EM的收敛性 其中, 当Q取极大值时,观测数据的似然也在相同点取极大值 EM算法会收敛到似然的局部极大值

混合模型中的EM算法 完整似然函数: 根据贝叶斯公式,Y的条件分布:

混合模型中的EM算法 E步 将完整似然函数和Y的条件分布代入Q函数中,经过复杂的变换得到, M步 求Q函数最大时的参数 反复迭代,直到收敛

GMM中的EM算法 高斯分布: 代入高斯分布的密度函数,计算得到如下的迭代公式: 第t次的估计为 则第t+1次的估计为

GMM中EM算法的迭代过程

提纲 高斯混合模型 EM算法的思想 EM算法的应用 总结 参考文献

GMM_EM求的参数为 (0.5958,-2.0767,1.9973,0.4042,2.9956,1.0044) 答案为 调用的接口为: estS = gmmb_em(rawdata', 'init', 'cmeans1', 'components', 2, 'thr', 1e-8); Matlab程序包的网址: http://www.it.lut.fi/project/gmmbayes/downloads/src/gmmbayestb/gmmbayestb-v1.0.tar.gz

提纲 高斯混合模型 EM算法的思想 EM算法的应用 总结 参考文献

总结 EM会收敛到局部极值,但不保证收敛到全局最优 对初值很敏感:通常需要一个好的、快速的初始化过程 适合的情况: 如K-均值 缺失数据不能太多 数据维数不能太高

提纲 高斯混合模型 EM算法的思想 EM算法的应用 总结 参考文献

参考文献 [1]http://icl.pku.edu.cn/yujs/papers/pdf/EM.pdf [2]http://www.jdl.ac.cn/user/lyqing/teaching/StatLearning/10_23ParametersEstimate3_EM.pdf [3] J. A. Bilmes (1998).A General Tutorial of the EM Algorithm and its Application to Parameter Estimation for Gaussian Mixture and Hidden Markov Models. [4]http://www.it.lut.fi/publications/files/publications/192/laitosrap95.pdf

多谢!欢迎多提意见!