Boosting原理及在分类上的应用 电子工程系 刘辉 2002 年 12 月 9 日.

Slides:



Advertisements
Similar presentations
四川财经职业学院会计一系会计综合实训 目录 情境 1.1 企业认知 情境 1.3 日常经济业务核算 情境 1.4 产品成本核算 情境 1.5 编制报表前准备工作 情境 1.6 期末会计报表的编制 情境 1.2 建账.
Advertisements

一、 一阶线性微分方程及其解法 二、 一阶线性微分方程的简单应用 三、 小结及作业 §6.2 一阶线性微分方程.
2.5 函数的微分 一、问题的提出 二、微分的定义 三、可微的条件 四、微分的几何意义 五、微分的求法 六、小结.
主编:邓萌 【点按任意键进入】 【第六单元】 教育口语. 幼儿教师教育口 语概论 模块一 幼儿教师教育口语 分类训练 模块二 适应不同对象的教 育口语 模块三 《幼儿教师口语》编写组.
第一組 加減法 思澄、博軒、暐翔、寒菱. 大綱 1. 加減法本質 2. 迷思概念 3. 一 ~ 七冊分析 4. 教材特色.
海南医学院附 院妇产科教室 华少平 妊娠合并心脏病  概述  妊娠、分娩对心脏病的影响  心脏病对妊娠、分娩的影响  妊娠合病心脏病的种类  妊娠合并心脏病对胎儿的影响  诊断  防治.
植树节的由来 植树节的意义 各国的植树节 纪念中山先生 植树节的由来 历史发展到今天, “ 植树造林,绿化祖国 ” 的热潮漫卷 了中华大地。从沿海到内地,从城市到乡村,涌现了多少 造林模范,留下了多少感人的故事。婴儿出世,父母栽一 棵小白怕,盼望孩子和小树一样浴光吮露,茁壮成长;男 女成婚,新人双双植一株嫩柳,象征家庭美满,幸福久长;
客户协议书 填写样本和说明 河南省郑州市金水路 299 号浦发国际金融中 心 13 层 吉林钰鸿国创贵金属经营有 限公司.
浙江省县级公立医院改革与剖析 马 进 上海交通大学公共卫生学院
第二章 环境.
產學攜手合作計畫 楊授印 國立虎尾科技大學 推廣教育中心 主任 動力機械工程系 助理教授 民國103年10月30日.
教师招聘考试 政策解读 讲师:卢建鹏
了解语文课程的基本理念,把握语文素养的构成要素。 把握语文教育的特点,特别是开放而有活力的语文课程的特点。
第2期技職教育再造方案(草案) 教育部 101年12月12日 1 1.
企业员工心态管理培训 企业员工心态管理培训讲师:谭小琥.
Some theoretical notes on boosting
区域教育信息中心工作的思考与探索 ----抓好应用建设 提升服务水平.
高三學長姐繁星及個人申請上榜 經驗分享(理組)
日月光·伯爵居项目介绍.
香港故事之 三年零八個月的艱苦歲月 組員: 梁珮瑩 吳遠莉 李琪 李青儀 方松皓.
谷雨节气模板.
MORE THAN HONEY 采 得 百 花 成 蜜 后 吕超逸
七(7)中队读书节 韩茜、蒋霁制作.
我的故事 ————往事回首.
郭子光教授从肺肾虚损辨治早中期慢性肾功能不全的经验
Bagging & Boosting.
教育部技職司 北區:2015年10月12日下午 南區:2015年10月16日下午
女生成功靠什么? 09英本四班 傅柏双.
国际投资环境罗氏评级法 美国.
社会保障学 第5章 失业保险.
第九章 建设中国特色社会主义政治.
广告法相关内容培训.
主 题 班 会 团 结   协 作    力 量.
理想.
唐雪峰 四川省疾病预防控制中心 四川省促进基本公共卫生服务均等化指导中心 2015年1月30日
固定与搬运技术 义乌市中心医院 陈红卫.
我国的宗教政策 第七课第三框.
中鸣虚拟搜救比赛项目 (一人) 现场主题创作(40%)(一人) 3D虚拟搜救(60%)(一人).
案例分析 胎记美容记 第6小组
辦理建教合作注意事項 國立台灣師範大學 鄭慶民
2015年 宝鸡校本研修与高效课堂第二次联合学情会 中国教师研修网宝鸡项目组
人生五色臉 年輕十歲必學的小動作,九個保持身體健康的的小訣竅 人們常在不經意間做些小動作,並認為這是身體的本能反應,
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
创办紫金矿业学院 为培养中国一流的矿业人才助力 ——合作创办紫金矿业学院的思路与实践
药店会员制营销.
学籍异动学生选课辅导 学年第1学期.
Introduction To Mean Shift
Introduction to AI and ML
Online job scheduling in Distributed Machine Learning Clusters
基于规则抽取的 时间表达式识别.
分布式程序设计 姚斌 计算机科学与工程系 上海交通大学.
第4章 非线性规划 4.5 约束最优化方法 2019/4/6 山东大学 软件学院.
习题 一、概率论 1.已知随机事件A,B,C满足 在下列三种情况下,计算 (1)A,B,C相互独立 (2)A,B独立,A,C互不相容
C语言程序设计 主讲教师:陆幼利.
2011 邀请中国姐妹学校韩国语研修团项目 申请时间: ~5月 27日 / 项目地点: 汉阳大学 安山校区 / 项目时间: (星期日) ~ 7.22(星期五) 费用: 100万元(韩币/人 (包含项目 - 学费, 教材费, 宿舍费, 接机费用及所有文化体验活动项目费用)
模型分类问题 Presented by 刘婷婷 苏琬琳.
概 率 统 计 主讲教师 叶宏 山东大学数学院.
WPT MRC. WPT MRC 由题目引出的几个问题 1.做MRC-WPT的多了,与其他文章的区别是什么? 2.Charging Control的手段是什么? 3.Power Reigon是什么东西?
相关与回归 非确定关系 在宏观上存在关系,但并未精确到可以用函数关系来表达。青少年身高与年龄,体重与体表面积 非确定关系:
一 测定气体分子速率分布的实验 实验装置 金属蒸汽 显示屏 狭缝 接抽气泵.
概 率 统 计 主讲教师 叶宏 山东大学数学院.
多层循环 Private Sub Command1_Click() Dim i As Integer, j As Integer
第 四 章 迴歸分析應注意之事項.
第一部分:概率 产生随机样本:对分布采样 均匀分布 其他分布 伪随机数 很多统计软件包中都有此工具 如在Matlab中:rand
基于最大margin的决策树归纳 李 宁.
两个变量的线性相关 琼海市嘉积中学 梅小青.
滤波减速器的体积优化 仵凡 Advanced Design Group.
基础信贷法律知识 讲解人:岳杨.
第三章 从概率分布函数的抽样 (Sampling from Probability Distribution Functions)
Presentation transcript:

Boosting原理及在分类上的应用 电子工程系 刘辉 2002 年 12 月 9 日

Outline 背景 Boosting原理 Boosting算法 Boosting应用 总结

背景 游戏理论(Game theory) R P S 锤子 布 剪子 锤子 ½ 1 0 布 0 ½ 1 剪子 1 0 ½ 锤子 布 剪子 锤子 ½ 1 0 布 0 ½ 1 剪子 1 0 ½ 游戏者1(row player): RSPPSRS… (损失最小化) 游戏者2(column player): SRRPSRP… (损失最大化)

背景 在线学习(On-line learning) 以上种种因素,如何综合考虑? 马以往的表现 马当前的状态 马的主人 场地安排 …….. 选哪个呢?

三个臭皮匠,胜过诸葛亮 背景 Boosting思想源于 Finding many rough rules of thumb can be a lot easier and more effective than finding a single, highly prediction rule.

原理引入 天气预报 预测明天是晴是雨? 传统观念:依赖于专家系统(A perfect Expert)

原理引入 A perfect expert Reality CNN (Perfect!) ABC CBS X X X

X 原理引入 CNN ABC CBS Reality Boosting:based on “Nobody is perfect”,combine common reporter to obtain perfect expert 更加符合自然界的现实 CNN ABC CBS Reality X

原理引入 X X X X X X 3 2 7/4 1 1 1/4 1/2 1 1/2 1 1/4 1/2 1/8 1 MON TUE WED THU REALITY MAJORITY CNN ABC CBS FOX TOTAL 32/8 28/8 26/8 15/8 3 2 7/4 X 1 X 1 1/4 1/2 X 1 1/2 1 1/4 1/2 1/8 1 X X X

Boosting—concepts(1) 机器学习(Machine Learning):将一些已知的并已被成功解决的问题作为范例输入计算机,机器通过学习这些范例总结并生成相应的规则,这些规则具有通用性,使用它们可以解决某一类的问题 。 人脸识别 文本分类 网络安全 生物信息工程 学习机(learner):机器学习得到的规则或者模型。 样本:所研究问题的实例,一般在训练集中包括正样本和负样本。 一张人脸图像,一篇文章,一个病毒代码,一个生物的遗传编码 训练:采用某种方法,用已知属性的样本作为输入,得到相应规则的过程。 训练集:由已知属性的样本组成的集合,作为训练过程的输入数据。 测试集:由已知属性的样本组成的集合,作为测试过程的输入数据。 假设:学习机对样本做出的判断,即是否符合需要判定的事实。 某张脸是否是张三的,某篇文章是否属于新闻类别

Boosting—concepts(2) 特征选取:从实际数据中抽取反映其本质规律的属性。 人脸图像向量做PCA变换得到特征向量的投影系数 对文本进行语法分析后表示成关于词的特征向量 机器学习系统结构表示

Boosting—concepts(3) 弱学习机(weak learner): 对一定分布的训练样本给出假设(仅仅强于随机猜测) 根据有云猜测可能会下雨 强学习机(strong learner): 根据得到的弱学习机和相应的权重给出假设(最大程度上符合实际情况:almost perfect expert) 根据CNN,ABC,CBS以往的预测表现及实际天气情况作出综合准确的天气预测 弱学习机 强学习机 Boosting

Boosting流程(loop1) 加权后的训练集 原始训练集 强学习机 弱学习机 弱假设 X>1?1:-1 加权后的假设

Boosting流程(loop2) 加权后的训练集 原始训练集 强学习机 弱学习机 弱假设 Y>3?1:-1 加权后的假设

Boosting流程(loop3) 加权后的训练集 原始训练集 强学习机 弱学习机 弱假设 Z>7?1:-1 加权后的假设

流程描述 Step1: 原始训练集输入,带有原始分布 Step2: 给出训练集中各样本的权重

核心思想 样本的权重 弱学习机的权重 循环控制:损失函数达到最小 没有先验知识的情况下,初始的分布应为等概分布,也就是训练集如果有N个样本,每个样本的分布概率为1/N 每次循环一后提高错误样本的分布概率,分错样本在训练集中所占权重增大, 使得下一次循环的弱学习机能够集中力量对这些错误样本进行判断。 弱学习机的权重 准确率越高的弱学习机权重越高 循环控制:损失函数达到最小 在强学习机的组合中增加一个加权的弱学习机,使准确率提高,损失函数值减小。

简单问题演示(Boosting训练过程)

算法—问题描述 训练集 { (x1,y1), (x2,y2),…, (xN,yN) } xi Rm, yi {-1,+1} Dt 为第t次循环时的训练样本分布(每个样本在训练集中所占的概率, Dt总和应该为1) ht:X{-1,+1} 为第t次循环时的Weak learner,对每个样本给出相应的假设,应该满足强于随机猜测: wt为ht的权重 为t次循环得到的Strong learner

算法—样本权重 思想:提高分错样本的权重 反映了strong learner对样本的假设是否正确 采用什么样的函数形式?

算法—弱学习机权重 思想:错误率越低,该学习机的权重应该越大 为学习机的错误概率 采用什么样的函数形式? 和指数函数遥相呼应:

算法--Adaboost

理论分析--最优化 如何求弱学习机的权重? 最基本的损失函数表达形式 为了便于计算,采用以下的目标函数 Boosting的循环过程就是沿着损失函数的负梯度方向进行最优化的过程。通过调整样本的分布Dt和选择弱学习机的权重wt来达到这个目的。每循环一次,增加一项 ,使损失函数以最快速度下降。

理论分析—熵映射 给定当前分布和选定的弱学习机,如何求下一次的分布? Boosting的设计思想: 改变分布,提高错误样本概率,使下一次的弱学习机能够集中精力针对那些困难样本。 调整分布后的训练集对当前学习机具有最大的随机性,正确率50%(恰好为随机猜测)

理论分析—熵映射 相对熵原理(最小鉴别信息原理) 已知随机变量X(样本集)的先验分布(Dt),并且已知所求未知分布Dt+1满足条件 ( Dt+1*Ut = 0 ),那么所求得的未知分布估计值具有如下形式: 物理意义:在只掌握部分信息的情况下要对分布作出判断时,应该选取符合约束条件但熵值取得最大的概率分布。从先验分布到未知分布的计算应该取满足已知条件,不确定度(熵)变化最小的解。

应用—人脸识别

应用—人脸识别

应用—文本分类

应用—文本分类

总结 Boosting的思想源泉: Boosting的数学实质: Boosting的理论联系: Boosting的应用 三个臭皮匠,胜过诸葛亮 将一系列粗略的规则加权组合起来得到高度精确的规则。 Boosting的数学实质: 对目标函数(损失函数)的最优化问题。 Boosting的理论联系: 最优化 熵映射 Boosting的应用 人脸识别 文本分类

参考资料 Internet站点 推荐论文 www.boosting.org http://mathworld.wolfram.com A Brief Introduction to Boosting Experiments with a New Boosting Algorithm Additive Logistic Regression: a Statistical View of Boosting The Boosting Approach to Machine Learning: an overview Game Theory, On-line Prediction and Boosting Boosting as Entropy Projection Logistic Regression, AdaBoost and Bregman Distances 以上论文均可在www.boosting.org下载

Thank you! Have a good supper! End  Thank you! Have a good supper!