教材：模式识别（第三版）张学工编著清华大学出版社

教材：模式识别（第三版）张学工编著清华大学出版社
条件概率密度函数的最大似然估计 Maximum Likelihood Estimation of Class-conditional Probability Density Function 任课教师：刘琼自动化学院教材：模式识别（第三版）张学工编著清华大学出版社

讲授提纲问题提出最大似然估计基于最大似然估计的模式分类实例

讲授提纲问题提出贝叶斯决策论贝叶斯公式最大似然估计基于最大似然估计的模式分类实例

问题提出（1/4） 80条鲑鱼，20条多宝鱼

？问题提出（2/4）贝叶斯决策论第一种情况：不知晓这条鱼的任何信息，判决依据P(ωi)的大小；结论：鲑鱼
第二种情况：给你这条鱼的宽度值 x，判决依据P (ωi| x)；鲑鱼贝叶斯决策论

问题提出（3/4）贝叶斯公式用非正式的英语表述先验概率类条件概率密度后验概率总体密度根据领域知识或大量样本中计算
各类样本所占的比例得到类条件概率密度后验概率总体密度所有样本关于特征x的概率密度

问题提出（4/4）函数形式估计目标估计方法已知函数中的未知参数参数估计未知非参数估计（kn近邻估计、Parzen窗法）
（最大似然估计、贝叶斯估计）未知非参数估计（kn近邻估计、Parzen窗法）

讲授提纲问题提出最大似然估计假设条件主要思想求解方法及解的分析正态分布参数的最大似然估计基于最大似然估计的模式分类实例

最大似然估计的假设条件假设条件：函数形式已知参数确定但未知样本独立同分布类类互不干扰
①类条件概率密度 p(x |ωi ) 的函数形式是已知的，但是其中的某些参数是未知的 ②待估计参数θ 是确定性的未知量 ③按类别将样本划分 c 类，第 i 样本都是从类条件概率密度 p(x |ωi ) 的总体中独立地抽取出来的 ④第 i 类的样本不包含有关 θj (i≠j)的信息。不同类别的函数在参数上相互独立，每一类样本可以独立进行处理函数形式已知参数确定但未知样本独立同分布类类互不干扰

它们是独立地按照概率密度 p(x | ωi ，θ ) 抽取出来的（独立同分布样本）
设ωi类样本集有 N 个样本它们是独立地按照概率密度 p(x | ωi ，θ ) 抽取出来的（独立同分布样本）似然函数可以表示为：含义：从总体中抽取 x1,…xN 这样 N 个样本的联合概率（可能性）

最大似然估计的主要思想最大似然估计的主要思想：如果在一次观察中一个事件出现了，则我们可以认为这一事件出现的可能性很大。现在，样本集（x1,…xN ）在一次观察（从概率总体中抽取一组样本）中居然出现了，则我们认为似然函数 l(θ) 应该达到最大值为了便于分析，可以取似然函数的对数，即对数函数是单调增函数，H(θ) 与 l(θ) 的最大值点相同

求最大似然估计量的方法如果H(θ) 满足连续可微的数学性质，可以直接应用高等数学的知识来求最大值点，即求梯度（偏导数）,并令其等于零，解线性或者非线性方程组得到估计量假设：有s个参数梯度算子

求解过程：从中求解出 θ 的最大似然估计量

最大似然估计结果的分析可能存在多个解解决方法：使得似然函数最大的解才是最大似然估计量

有可能求不出正确的解（比如均匀分布）

例：正态分布函数的最大似然估计单变量正态分布的概率密度函数要求的未知参数（均值与方差）
已知，利用最大似然估计法，针对上述样本集，求出均值与方差的估计值

对数似然函数求偏导数

解释：正态分布总体均值的最大似然估计量是样本属性值的算术平均（无偏）正态分布总体方差的最大似然估计量是样本方差的算术平均（渐进无偏）
推广到多元正态分布（无偏）

讲授提纲问题提出最大似然估计基于最大似然估计的模式分类实例

？基于最大似然估计的模式分类实例已知条件：问题：对箱中的鱼进行贝叶斯分类决策 80条鲑鱼，20条多宝鱼
对于宽度特征，两类鱼均服从正态分布箱中这条鱼的宽度为10cm 问题：对箱中的鱼进行贝叶斯分类决策

Step1：数据准备数据获取：对80条鲑鱼和20条多宝鱼分别测得他们的宽度值数据预处理：剔除野值数据（如发育不正常的个例）
特征形成：每一条鱼有两个数据：类别标识宽度（特征） …… …….

Step2 ：类条件概率密度函数估计两类样本分别满足各自的正态分布，利用最大似然估计方法分别求出鲑鱼和多宝鱼关于宽度特征的均值和方差的最大似然估计量为鲑鱼关于宽度特征的均值和方差的最大似然估计结果：多宝鱼关于宽度特征的均值和方差的最大似然估计结果：

Step3：后验概率计算关于宽度特征的类条件概率密度曲线关于宽度特征的后验概率曲线

Step4：分类决策当黑箱中鱼的宽度为10cm时决策结果：该鱼为多宝鱼

小结概率密度函数估计的目的与基本概念最大似然函数参数估计方法,并应用于正态分布中的参数估计(均值与方差)
目的：用于最小错误率贝叶斯决策分类概念：某类关于特征x的概率分布，依据分布函数形式是否已知，可将估计方法分为两类最大似然函数参数估计方法,并应用于正态分布中的参数估计(均值与方差) 方法：通过将似然函数对未知参数求偏导数，并令其为0，解方程组得到未知参数的估计量正态分布：均值——无偏估计；方差——渐近无偏估计基于最大似然估计对模式进行分类决策

教材：模式识别（第三版）张学工编著清华大学出版社

Similar presentations

Presentation on theme: "教材：模式识别（第三版）张学工编著清华大学出版社"— Presentation transcript:

Similar presentations

About project

反馈

请登录

Auth with social network:

教材：模式识别（第三版） 张学工编著 清华大学出版社

Similar presentations

Presentation on theme: "教材：模式识别（第三版） 张学工编著 清华大学出版社"— Presentation transcript:

Similar presentations

About project

反馈

教材：模式识别（第三版）张学工编著清华大学出版社

Presentation on theme: "教材：模式识别（第三版）张学工编著清华大学出版社"— Presentation transcript: