Support Vector Machine 支持向量机

Slides:



Advertisements
Similar presentations
一、 一阶线性微分方程及其解法 二、 一阶线性微分方程的简单应用 三、 小结及作业 §6.2 一阶线性微分方程.
Advertisements

第五节 函数的微分 一、微分的定义 二、微分的几何意义 三、基本初等函数的微分公式与微分运算 法则 四、微分形式不变性 五、微分在近似计算中的应用 六、小结.
第八章 第四节 机动 目录 上页 下页 返回 结束 一个方程所确定的隐函数 及其导数 隐函数的微分法.
全微分 教学目的:全微分的有关概念和意义 教学重点:全微分的计算和应用 教学难点:全微分应用于近似计算.
人的性别遗传 合肥市第四十九中学 丁 艳. 男女成对染色体排序图 1 、男性和女性各 23 对染色体有何异同 ? 哪 一对被称为性染色体 ? 2 、这两幅图中,哪幅 图显示的是男性的染色 体?哪幅图显示的是女 性染色体? 3 、图中哪条染色体是 Y 染色体?它与 X 染色体 在形态上的主要区别是.
肺癌放疗新概念: 瘤根靶向放疗 北京大学临床肿瘤学院 北京肿瘤医院放疗科.
1、一般地说,在生物的体细胞中, 和 都是成对存在的。
辨性别 A B. 辨性别 A B 第三节人类染色体与性别决定 昌邑市龙池初中 杨伟红 学习目标 1.理解人的染色体组成和传递规律。 2.解释人类性别决定的原理。 3.通过探究活动,解读数据了解生男生女的比例。
《解析几何》 -Chapter 3 §7 空间两直线的相关位置.
Svm基本知识与原理 张立新.
毛峰教授 北京师范大学教授,博士生导师 国家社科基金项目专家 北京华文教育顾问
《解析几何》 乐山师范学院 0 引言 §1 二次曲线与直线的相关位置.
一、能线性化的多元非线性回归 二、多元多项式回归(线性化)
一、平面点集 定义: x、y ---自变量,u ---因变量. 点集 E ---定义域, --- 值域.
第三章 函数逼近 — 最佳平方逼近.
第五课 让挫折丰富我们的人生 挫折面前也从容.
统计学习 Statistical Learning
管理学基本知识.
第八章 统计学习理论与SVM (Chapter8 SLT & SVM )
滁州学院首届微课程教学设计竞赛 课程名称:高等数学 主讲人:胡贝贝 数学与金融学院.
§1 线性空间的定义与性质 ★线性空间的定义 ★线性空间的性质 ★线性空间的子空间 线性空间是线性代数的高等部分,是代数学
1.1.2 四 种 命 题.
色 弱 與 色 盲.
宠物之家 我的宠物性别? 雌(♀) or 雄(♂) 第一阶段:我的宠物我做主 第二阶段:宠物“相亲记” 第三阶段:家族诞生
第四节 一阶线性微分方程 线性微分方程 伯努利方程 小结、作业 1/17.
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
拾貳、 教育行政 一、教育行政的意義 教育行政,可視為國家對教育事務的管理 ,以增進教育效果。 教育行政,乃是一利用有限資源在教育參
課程銜接 九年一貫暫行綱要( )  九年一貫課程綱要( ) 國立台南大學數學教育系 謝 堅.
2.3 变量间的相关关系 变量之间的相关关系 两个变量的线性相关 第二课时.
2.4 二元一次方程组的应用(1).
Introduction To Mean Shift
支持向量机 Support Vector Machines
第五讲 支持向量机网络.
 做一做   阅读思考 .
Cyclic Hanoi问题 李凯旭.
Introduction to AI and ML
Online job scheduling in Distributed Machine Learning Clusters
What have we learned?.
数据挖掘工具性能比较.
动态规划(Dynamic Programming)
近期科研汇报 报告人: 纪爱兵.
核函数方法及其在过程控制中的应用研究 Studies on the kernel-based methods
双曲线的简单几何性质 杏坛中学 高二数学备课组.
第4章 非线性规划 4.5 约束最优化方法 2019/4/6 山东大学 软件学院.
第二十二章 曲面积分 §1 第一型曲面积分 §2 第二型曲面积分 §3 高斯公式与斯托克斯公式.
第三单元 第3课 实验 多元函数的积分 实验目的:掌握matlab计算二重积分与三重积分的方法,提高应用重积分解决有关应用问题的能力。
顺序表的删除.
3.8.1 代数法计算终点误差 终点误差公式和终点误差图及其应用 3.8 酸碱滴定的终点误差
模型分类问题 Presented by 刘婷婷 苏琬琳.
线性规 Linear Programming
WPT MRC. WPT MRC 由题目引出的几个问题 1.做MRC-WPT的多了,与其他文章的区别是什么? 2.Charging Control的手段是什么? 3.Power Reigon是什么东西?
成绩是怎么算出来的? 16级第一学期半期考试成绩 班级 姓名 语文 数学 英语 政治 历史 地理 物理 化学 生物 总分 1 张三1 115
第三单元 第2课 实验 一元函数的积分 实验目的:掌握matlab求解有关不定积分和定积分的问题,深入理解定积分的概念和几何意义。
§6.7 子空间的直和 一、直和的定义 二、直和的判定 三、多个子空间的直和.
3.1 变化率与导数   3.1.1 变化率问题 3.1.2 导数的概念.
3.1.2 空间向量的数量积运算 1.了解空间向量夹角的概念及表示方法. 2.掌握空间向量数量积的计算方法及应用.
数据集的抽取式摘要 程龚, 徐丹云.
1.非线性规划模型 2.非线性规划的Matlab形式
基于最大margin的决策树归纳 李 宁.
建模常见问题MATLAB求解  .
两个变量的线性相关 琼海市嘉积中学 梅小青.
古佳怡 AI 人工智慧.
配合康軒版 社會科第一單元 第五課 製作者:周秀卿、 簡維萱
线性规划 Linear Programming
数据挖掘导论 福建医科大学 郑伟成.
用加減消去法解一元二次聯立方程式 台北縣立中山國中 第二團隊.
一元一次方程的解法(-).
统计学习理论和SVM(支持向量机).
Presentation transcript:

Support Vector Machine 支持向量机 张鑫 2002. 2.1

提纲 SVM的有关概念介绍 SVM问题的数学表示和推导 SVM的分解算法 简单的最优分类面SVM 广义最优分类面 SVM

SVM的描述 SVM是一种基于统计学习理论的模式识别方法,它是由Boser,Guyon,Vapnik在COLT-92上首次提出,从此迅速的发展起来,现在已经在许多领域(生物信息学,文本和手写识别等)都取得了成功的应用 COLT(Computational Learning Theory)

目标:找到一个超平面,使得它能够尽可能多的将两类数据点正确的分开,同时使分开的两类数据点距离分类面最远。 解决方法:构造一个在约束条件下的优化问题,具体的说是一个受限二次规划问题(constrained quadratic programing),求解该问题,得到分类器。

模式识别问题的一般描述 已知:n个观测样本,(x1,y1), (x2,y2)…… (xn,yn) 求:最优函数y’= f(x,w) 满足条件:期望风险最小 损失函数

期望风险R(w)要依赖联合概率F(x,y)的信息,实际问题中无法计算。 一般用经验风险Remp(w)代替期望风险R(w)

一般模式识别方法的问题 经验风险最小不等于期望风险最小,不能保证分类器的推广能力. 经验风险只有在样本数无穷大趋近于期望风险,需要非常多的样本才能保证分类器的性能。 需要找到经验风险最小和推广能力最大的平衡点。

最优分类面 简单情况:在线性可分的情况下的最优分类面(Margine最大)

SVM问题的数学表示 已知:n个观测样本,(x1,y1), (x2,y2)…… (xn,yn) 目标:最优分类面 wx-b=0 满足条件:是分类面 经验风险最小(错分最少) 推广能力最大(空白最大)

分类面方程满足条件 对(xi,yi) 分类面方程g(x)=wx-b应满足 即

空白 空白长度 =2x样本点到直线的距离 =2x

SVM问题的数学表示 已知:n个观测样本,(x1,y1), (x2,y2)…… (xn,yn) 求解: 目标:最优分类面 wx-b=0

广义最优分类面SVM 分类面条件的放宽 经验风险最小 空白最大(不变)

SVM的数学表示 已知:n个观测样本,(x1,y1), (x2,y2)…… (xn,yn) 求解: 目标:最优分类面 wx-b=0

SVM问题求解 将上述问题表示成拉格朗日乘子式 Kuhn-Tucker条件

得到 只要确定,便可解出w,b

将上述条件代入L中 新的优化问题 (Quadratic Programing)

SVM问题求解 已知:n个观测样本,(x1,y1), (x2,y2)…… (xn,yn) 求解 根据,求得w,b ,得到最优分类面

非线性分类面 非线性可分的数据样本在高维空间有可能转化为线性可分。 在训练问题中,涉及到训练样本的数据计算只有两个样本向量点乘的形式 使用函数 ,将所有样本点映射到高为空间,则新的样本集为 设函数

SVM的一般表示 已知:n个观测样本,(x1,y1), (x2,y2)…… (xn,yn) 求解 最优非线性分类面为

通常的内核函数 线性内核 径向基函数内核 多项式内核 S形内核

多项式内核

SVM的计算 求解如下问题: D={ yiyjxixj } D的存储代价=0.5 x (训练样本数)2 x 单元存储空间 0.5 x(7000)2x8=196 x 106 Byte

二次规划问题求解

SVM的分解算法 Edgar Osuna(Cambridge ,MA)等人在IEEE NNSP’97发表了An Improved Training Algorithm for Support Vector Machines ,提出了SVM的分解算法

SVM的分解算法 将向量分成两个集合,工作集B,固定集N。即 每次对B解决一个小的二次规划问题,保持N中的值不变 每次迭代检查当前结果,满足优化条件,则找到了优化问题的解,算法结束。

SVM的分解算法

SVM的分解算法 常数项 相等项 工作集的大小可以人为指定

SVM的分解算法 Proposition(Build down): moving a variable from B to N leaves the cost function unchanged,and the solution is feasible in the subproblem Proposition(Build up) moving a variable that violates the optimality condition from N to B gives a strict improvement in the cost function when the subproblem is re-optimized

SVM的分解算法 Arbitrarily choose |B| points from the data set. Solve the subproblem defined by the variable in B. While there exist some j jN,such that replace any i ,i  B,with j and solve the new subproblem.

SVM分解算法的实例 SVMlight SMO Thorsten Joachims (UniversityDortmund ,Informatik, AI-Unit) Make Large-Scale SVM Learning Practical SMO John C. Platt (Microsoft Research) Fast Training of Support Vector Machines using Sequential Minimal Optimization

谢谢