核函数方法及其在过程控制中的应用研究 Studies on the kernel-based methods

Slides:

Advertisements

Similar presentations

一、一阶线性微分方程及其解法二、一阶线性微分方程的简单应用三、小结及作业 §6.2 一阶线性微分方程.

Advertisements

第五节函数的微分一、微分的定义二、微分的几何意义三、基本初等函数的微分公式与微分运算法则四、微分形式不变性五、微分在近似计算中的应用六、小结.

2.8 函数的微分 1 微分的定义 2 微分的几何意义 3 微分公式与微分运算法则 4 微分在近似计算中的应用.

2.5 函数的微分一、问题的提出二、微分的定义三、可微的条件四、微分的几何意义五、微分的求法六、小结.

全微分教学目的：全微分的有关概念和意义教学重点：全微分的计算和应用教学难点：全微分应用于近似计算.

信号与系统第三章傅里叶变换东北大学 2017/2/27.

§3.4 空间直线的方程.

3.4 空间直线的方程.

第五章二次型. 第五章二次型知识点1---二次型及其矩阵表示二次型的基本概念 1. 线性变换与合同矩阵 2.

一、能线性化的多元非线性回归二、多元多项式回归（线性化）

一、二阶行列式的引入用消元法解二元线性方程组. 一、二阶行列式的引入用消元法解二元线性方程组.

第三章函数逼近 — 最佳平方逼近.

第八章统计学习理论与SVM (Chapter8 SLT & SVM )

《高等数学》（理学）常数项级数的概念袁安锋

§1 线性空间的定义与性质 ★线性空间的定义 ★线性空间的性质 ★线性空间的子空间线性空间是线性代数的高等部分，是代数学

第四节一阶线性微分方程线性微分方程伯努利方程小结、作业 1/17.

第三节格林公式及其应用（2）一、曲线积分与路径无关的定义二、曲线积分与路径无关的条件三、二元函数的全微分的求积四、小结.

§5 微分及其应用一、微分的概念实例:正方形金属薄片受热后面积的改变量..

2-7、函数的微分教学要求教学要点.

§5 微分及其应用一、微分的概念实例:正方形金属薄片受热后面积的改变量..

第五讲支持向量机网络.

Support Vector Machine 支持向量机

数控技术华中科技大学机械科学与工程学院.

Windows网络操作系统管理 ——Windows Server 2008 R2.

§2 求导法则 2.1 求导数的四则运算法则下面分三部分加以证明, 并同时给出相应的推论和例题 .

Introduction to AI and ML

Online job scheduling in Distributed Machine Learning Clusters

What have we learned?.

基于类间最大间隔多级决策树报告人：霍建兵.

第十章方差分析.

数据挖掘工具性能比较.

Support Vector Machines

动态规划(Dynamic Programming)

若2002年我国国民生产总值为亿元，如果，那么经过多少年国民生产总值每年平均增长是2002年时的2倍？解：设经过年国民生产总值为2002年时的2倍, 根据题意有，即.

第4章非线性规划 4.5 约束最优化方法 2019/4/6 山东大学软件学院.

第一章函数与极限.

简单介绍用C++实现简单的模板数据结构 ArrayList(数组, 类似std::vector)

3.8.1 代数法计算终点误差终点误差公式和终点误差图及其应用 3.8 酸碱滴定的终点误差

模型分类问题 Presented by 刘婷婷苏琬琳.

线性规 Linear Programming

WPT MRC. WPT MRC 由题目引出的几个问题 1.做MRC-WPT的多了，与其他文章的区别是什么？ 2.Charging Control的手段是什么？ 3.Power Reigon是什么东西？

第4章 Excel电子表格制作软件 4.4 函数（一）.

课件及程序代码.

正切函数的图象和性质周期函数定义：一般地，对于函数 (x),如果存在一个非零常数T，使得当x取定义域内的每一个值时，都有

iSIGHT 基本培训使用 Excel的栅栏问题

§6.7 子空间的直和一、直和的定义二、直和的判定三、多个子空间的直和.

3．1．2 空间向量的数量积运算 1．了解空间向量夹角的概念及表示方法． 2．掌握空间向量数量积的计算方法及应用．

相关与回归非确定关系在宏观上存在关系，但并未精确到可以用函数关系来表达。青少年身高与年龄，体重与体表面积非确定关系：

魏新宇 MATLAB/Simulink 与控制系统仿真魏新宇

1.非线性规划模型 2.非线性规划的Matlab形式

海报题目简介: 介绍此项仿真工作的目标和需要解决的问题。可以添加合适的图片。

基于最大margin的决策树归纳李宁.

《工程制图基础》第五讲投影变换.

第15讲特征值与特征向量的性质主要内容：特征值与特征向量的性质.

第二节函数的极限一、函数极限的定义二、函数极限的性质三、小结思考题.

正弦、余弦函数的性质华容一中伍立华 2017年2月24日.

§2 方阵的特征值与特征向量.

基于列存储的RDF数据管理朱敏

教学大纲（甲型，54学时）教学大纲（乙型， 36学时）

本底对汞原子第一激发能测量的影响钱振宇

线性规划 Linear Programming

第三节数量积向量积混合积一、向量的数量积二、向量的向量积三、向量的混合积四、小结思考题.

第十七讲密码执行(1).

FVX1100介绍法视特（上海）图像科技有限公司施俊.

质量控制（QC）模式 BrookFIELD.

§2 自由代数定义19.7:设X是集合，G是一个T-代数，为X到G的函数,若对每个T-代数A和X到A的函数，都存在唯一的G到A的同态映射,使得=，则称G(更严格的说是(G,))是生成集X上的自由T-代数。X中的元素称为生成元。 A变， 变 变， 也变对给定的 和A，是唯一的.

海报题目简介: 介绍此项仿真工作的目标和需要解决的问题。可以添加合适的图片。

统计学习理论和SVM(支持向量机).

Presentation transcript:

核函数方法及其在过程控制中的应用研究 Studies on the kernel-based methods and its applications in process control 核函数方法及其在过程控制中的应用

主要内容 Kernel trick Kernel-based methods Applications Kernel chemometric Kernel PCA, Kernel PCR Kernel PLS Kernel Fisher Discriminant Support vector machines Support vector classification machines Support vector regression machines Applications 核函数方法及其在过程控制中的应用

研究背景人类具有通过事例学习能力，并能举一反三。因此，希望在对机器智能的研究中，也希望它具有该能力。传统方法及其局限性统计学在解决机器学习的问题中取基础作用传统统计学研究的主要是渐近理论，即当样本趋向无穷多时的统计性质 Vapnik等人系统地研究了有限样本情况下的机器学习问题，建立了统计学习理论（SLT）的基本体系。 SVM 在应用研究中展示了良好的性能核函数方法及其在过程控制中的应用

由于工业过程的复杂性，（多变量、非线性、时变、分布参数、信息不完全、信息冗余等）。基于过程机理的方法在应用研究中遇到困难。过程控制借鉴了机器学习中的理论与方法，如ANN。取得了较丰富的成果。 ANN的困境缺乏坚实的理论基础解决复杂问题表现出的局限性过学习局部最小点模型结构何参数确定依赖于经验对样本容量与分布特性要求核函数方法及其在过程控制中的应用

SLT系统地研究了小样本情况下的机器学习问题。理论扎实 SLT与SVM SLT系统地研究了小样本情况下的机器学习问题。理论扎实 SVM是基于SLT的通用机器学习方法 SVM方法又促进了核函数方法的应用研究 SVM与BPNN的比较，有一系列优点现有的研究表明，SVM在模式识别等领域的应用研究中，对于一些Benchmark问题，结果优于ANN方法。 SVM的特点，十分有利于处理过程控制中的复杂特性。核函数方法及其在过程控制中的应用

过程控制中广泛存在多变量问题，数据量大，信息冗余。线性多元特征提取方法应用较多。如基于PCA的过程状态监测与故障诊断。但很难提取非线性特性。回归方法，如PCR,PLS等在过程建模上应用较多。它们本质上仍然属于线性方法。用核函数方法改造传统线性Chemometric方法受到广泛重视。核函数方法及其在过程控制中的应用

Kernel trick 根据模式识别理论，低维空间线性不可分的模式通过非线性映射到高维特征空间则可能实现线性可分，而且在高维特征空间中再提取特征信息也会更容易。如函数型连接网络。图2 函数型连接网络核函数方法及其在过程控制中的应用

实际上很难单纯采用这种方法，因为存在如下几个难点：非线性函数形式的确定。特征空间维数的确定。高维特征空间进行计算时的维数灾难。核函数技术（kernel tricks）的基本思想是把非线性变换后的高维特征空间的内积运算转换为原始输入空间中的核函数的计算，即通过来实现的。把采用kernel tricks的方法称为核函数方法。核函数方法及其在过程控制中的应用

避免了直接在变换后的特征空间的运算，大大减小了计算量，避免了“维数灾难”。采用核函数后，没有必要知道非线性变换函数的形式核函数方法的特点：避免了直接在变换后的特征空间的运算，大大减小了计算量，避免了“维数灾难”。采用核函数后，没有必要知道非线性变换函数的形式特征空间的维数甚至可以是无穷大。核函数的选择也不困难，满足Mercer条件的任意对称函数都可作核函数。核函数方法及其在过程控制中的应用

图3 Kernel tricks示意图核函数方法及其在过程控制中的应用

常用核函数高斯核函数指数型核函数多项式核函数感知器核函数 B样条核函数核函数方法及其在过程控制中的应用

SLT与SVM的主要内容 SLT 主要内容统计学习理论就是研究小样本统计估计和预测的理论，主要内容包括四个方面经验风险最小化准则下统计学习一致性的条件在这些条件下关于统计学习方法推广性的界的结论在这些界的基础上建立的小样本归纳推理准则实现新的准则的实际方法(算法) 核函数方法及其在过程控制中的应用

SLT与SVM的主要内容（续） VC维为了研究学习过程一致收敛的速度和推广性，SLT定义了一系列有关函数集学习性能的指标，VC维是最重要的。定义：对一个指示函数集，如果存在h个样本能够被函数集中的函数按所有可能的种形式分开，则称函数集能够把h个样本打散。函数集的VC维就是它能打散的最大样本数目h。 VC维反映了函数集的学习能力，VC维越大则学习机器越复杂(容量越大) 目前尚没有通用的关于任意函数集VC维计算的理论核函数方法及其在过程控制中的应用

SLT与SVM的主要内容（续）推广性的界这一结论从理论上说明了学习机器的实际风险由两部分组成：一是经验风险（训练误差），另一部分称作置信范围，它和学习机器的VC维及训练样本数有关核函数方法及其在过程控制中的应用

在有限训练样本条件下，分类模型的VC维越高（复杂性越高）则置信范围越大，导致真实风险与经验风险之间可能的差别越大，这就是出现过学习的原因。 SLT与SVM的主要内容（续）在有限训练样本条件下，分类模型的VC维越高（复杂性越高）则置信范围越大，导致真实风险与经验风险之间可能的差别越大，这就是出现过学习的原因。机器学习过程不但要使经验风险最小，还要使VC维尽量小以缩小置信范围，才能取得较小的实际风险，即对未来样本有较好的推广性。核函数方法及其在过程控制中的应用

SLT与SVM的主要内容（续）结构风险最小化函数集子集 VC维：图4 结构风险最小化示意图核函数方法及其在过程控制中的应用

SLT与SVM的主要内容（续）实现SRM原则可以有两种思路在每个函数子集中求最小经验风险，然后选择使最小经验风险和置信范围之和最小的子集。当子集数目很大甚至是无穷时不可行设计函数集的某种结构使每个子集中都能取得最小的经验风险（如使训练误差为0），然后只需选择选择适当的子集使置信范围最小，则这个子集中使经验风险最小的函数就是最优函数。SVM即采用这种思路传统方法，如ANN，选择模型和算法的过程即为调整置信范围。当确定后，再最小化经验风险。可惜上述选择和调整无理论指导，依赖设计者经验。核函数方法及其在过程控制中的应用

SLT与SVM的主要内容（续） SVM 主要内容 SVM方法是从线性可分情况下的最优分类面提出的所谓最优分类面，就是这样的分类超平面，它不但能够将所有训练样本正确分类，而且使训练样本中离分类面最近的点到分类面的距离(定义为间隔)最大在线性不可分的情况下，通过非线性变换将输入空间变换到一个高维特征空间。在新的特征空间中求取最优线性分类面，而这个非线性变换是通过核函数实现的支持向量是训练数据集合的子集核函数方法及其在过程控制中的应用

SLT与SVM的主要内容（续）图5 最优分类面核函数方法及其在过程控制中的应用

SLT与SVM的主要内容（续）通过使间隔最大化来控制分类器的复杂度、进而实现较好的推广能力正则化方法应用 kernel tricks应用把优化问题转换为二次规划问题，因此避免了局部最小化问题。用于模式识别的SVC推广到实函数估计的SVR 核函数方法及其在过程控制中的应用

SVC 简介已知数据集：最优超平面：假设数据集可以被一个超平面没有错误地分开，则与两类样本点距离最大的分类超平面会获得最佳的推广能力。支持向量到最优超平面的距离为求最优超平面的问题转化为如下最优化问题：按照最优化理论中二次规划的解法，可把该问题转化为Wolfe对偶问题来求解。构造Lagrange函数：核函数方法及其在过程控制中的应用

其中是Lagrange乘子根据最优化原理有：即：核函数方法及其在过程控制中的应用

将两式代回Lagrange函数中，消去w和b，经运算得到原最优化问题的Wolfe对偶问题：其解是原最优化问题的整体最优解。可采用优化算法解出；参数b可根据Karush-Kuhn-Tucker条件求出：最后求得得最优超平面为：需要注意的是只有支持向量所对应的Lagrange乘子才不是0。核函数方法及其在过程控制中的应用

对于线性不可分的分类问题，可以将输入x通过非线性函数映射到高维特征空间，在此空间再进行线性分类。最终结果为，以核函数代替上式中的。即显然，在结构上它等效于三层前向神经网络。核函数方法及其在过程控制中的应用

图6 SVM结构示意图核函数方法及其在过程控制中的应用

SVMs 表1 前馈神经网络与SVMs比较不同点前馈神经网络理论基础（优化原则）经验风险最小化结构风险最小化对训练数据要求大样本，数据质量要较高小样本，可处理稀疏数据模型结构和参数确定先确定模型结构，再确定模型参数，反复训练、试凑。经验影响较大结构和参数可以通过训练由训练算法自动同时确定优化的全局性可能陷入局部最小点全局优化模型参数数量模型参数多模型参数较少模型推广能力较差较好模型训练难易程度通常较难相对较容易计算复杂度取决于样本输入变量的维数和样本维数与样本输入变量维数无关，取决于样本维数核函数方法及其在过程控制中的应用

SVR 简介设给定l个训练样本，其中是n维输入；是样本输出。非线性回归就是找到一个非线性函数f，能够逼近输入和输出之间的关系。采用与非线性分类支持向量机类似的方法，首先将输入通过非线性函数映射到高维特征空间F，将非线性函数回归问题转化为高维空间的线性回归。设所求逼近函数为：，其中h为高维特征空间维数，b为偏置量。由于是固定不变的，因此影响w的有经验风险的总和以及使函数f在高维空间平滑的。因此有：其中e(.)是损失函数，是正则化常数核函数方法及其在过程控制中的应用

对不同的损失函数e(.)，式（19）的优化问题有不同的形式。最小化便得到用数据点表示的w 其中和是最小化的解，综上所述有：对不同的损失函数e(.)，式（19）的优化问题有不同的形式。常用的损失函数有 Vapnik －不灵敏度损失函数，二次－不灵敏度损失函数 Huber损失函数等。参数b可根据Karush-Kuhn-Tucker条件求出。核函数方法及其在过程控制中的应用

模型选择正则化参数损失函数核的类型及核参数等核函数方法及其在过程控制中的应用 SVMs模型性能很大程度上取决于模型参数，SVMs模型选择包括多个方面，正则化参数损失函数核的类型及核参数等核函数方法及其在过程控制中的应用

Kernel chemometric Kernel PCA, Kernel PCR Kernel PLS Kernel Fisher Discriminant（KFD）核函数方法及其在过程控制中的应用

国内外研究现状研究主要集中在目前应用领域与成果各种改进型SVM，如LS-SVM, v-SVM,Fuzzy SVM SVM算法模式识别回归估计数据挖掘工程应用研究结果令人满意核函数方法及其在过程控制中的应用

SVM算法 SVMlight为代表的分解算法在线训练算法序贯分类算法SMO，适用于回归和函数估计对多类分类问题，标准算法是对于n类问题构造n个两类分类器，第i个SVM用第i类中的训练样本作为正的训练样本，而将其它的样本作为负的训练样本，这种算法称为“一对多”（one against all model）。这样需要构造的SVM分类器的数目等于数据样本的模式数目。这种方式的缺点是对每个分类器的要求较高。第二种是“一对一”（one against one model）策略，即为了对n个类的训练样本进行两两区分，分别构造n(n+1)/2个SVM分类器。在测试时，使用成对的SVM进行鉴别比较，每一次淘汰一个SVM分类器，而优胜者间继续进行竞争淘汰，直到最后仅剩一个优胜者。该优胜SVM分类器的输出决定测试数据的类别。核函数方法及其在过程控制中的应用

核函数方法及其在过程控制中的应用

我国研究现状 80年代末，边肇祺等注意到该研究，但由于SVM还没提出，研究较少 90年代末，研究逐步增多，到2000以后，迅速增多，形成研究热点 2000年后，过程控制领域的应用开始见诸报道软测量系统辨识但多数是仿真研究，工业应用研究报道较少。核函数方法及其在过程控制中的应用

本人工作介绍基于SVM和核函数方法的过程软测量建模研究基于SVM的故障诊断方法研究 SVM软测量建模 PCA-SVM软测量建模， KPCA-SVM软测量建模核函数PCA、核函数PLS、核函数PCR等软测量建模基于SOM-SVM的多模型软测量建模基于SVM的故障诊断方法研究故障诊断是典型的小样本问题，因此用SVM方法研究故障诊断问题是十分合适的 SVM用于故障诊断：直接建立故障诊断模型用于残差分析分别采用SVM分类中的“一对多”和“一对一”策略，将复杂故障诊断问题分解，研究其基于SVM的递阶故障诊断方法核函数方法及其在过程控制中的应用

本人工作介绍（续）基于SVM的动态建模方法研究基于SVM的数据挖掘方法及其在过程控制中的应用研究研究适合于动态建模的核函数及参数选择策略提出SVM-PLS混合模型建模方法，并用于复杂工业过程动态建模基于SVM的数据挖掘方法及其在过程控制中的应用研究基于SVM的数据挖掘方法在过程优化中的应用基于SVM的数据挖掘方法在状态监测中的应用核函数PCA等方法在过程数据预处理中的应用数据校正去噪核函数方法及其在过程控制中的应用

主要参考数目与资源 1 张学工.关于统计学习理论与支持向量机.自动化学报[J]，2000,26(1):32-42. 2 Vapnik V N, The Nature of Statistical Learning Theory[M], NY: Springer-Verlag,1998. 3 Müller K-R., Mika S., Rätsch G., et al. An introduction to kernel-based learning algorithms, IEEE transactions on neural networks, 2001,12(2):181-202. 4 J.K.A.Suykens, T.V.Gestel and J.D.Brabanter et al. Least Squares Support Vector Machines. Worle Scientific Publishing Co. Pte. Ltd. Singapore, 2002 5 Cristianini N., Shawe-Taylor J., An Introduction to Support Vector Machines, Cambridge University Press. 2000. 6 Scholkopf,B, Smola,A.J. Learning with kernels. Cambridge,MA:MIT Press www.kernel-machine.com 核函数方法及其在过程控制中的应用

谢谢！核函数方法及其在过程控制中的应用