欠拟合与过拟合 龙沛洵 2018.9.6.

Slides:



Advertisements
Similar presentations
努力创建学习型党组织 莲都区委学校 刘宏华. 内容提纲 一、学习的含义。 二、学习型组织内涵。 三、建设学习型党组织的原则和要求。 主要参考书目: 《第五项修炼》,彼得 · 圣吉,中信出 版社, 2010 年 5 月第 6 次印刷。
Advertisements

常識科分享會 6/11/2004 常識科新課程的實踐與評估 教育統籌局 課程發展處 小學校本課程發展組.
103上語音專題第二階段題目.
博奥文明之旅团支部 ——师范学院小学教育专业063团支部.
邏 輯 課程網頁: /
思想道德修养与法律基础 ( 2013修订版) 第一章 追求远大理想 坚定崇高信念.
二00四年鼓勵公務人員提升英語能力宣導說明會
晤談技巧 具體(Concreteness)
普通話水平測試 考試課程與能力等級說明 查詢
報告人:朝陽科技大學保險金融管理系 施懿純 助理教授
问卷调查的规范与技术 问卷调查的规范与技术.
义务教育语文课程标准 修定与发展趋势介绍 华中师范大学 雷 实.
分類:基本概念、決策樹與模型評估.
大规模深度学习算法 Deep Belief Network及其应用
建筑工程项目管理.
99年成語200題庫(21-40).
关于在宝钢全体党员中开展“学党章党规、 学系列讲话,做合格党员”学习教育的 实施方案
Blended Learning Solution for PLS
商業概論 第七章 人力資源管理 第三節 徵才與訓練.
宋 弘 仁 計畫主持人 經理 數位學習專案經歷 學歷 專長 經歷 相關證照
感知学习 ——可视化学习平台.
北京市第八十中学高中部 2006—2007学年度教育工作布置会.
电视节目播音主持 第四讲 谈话类、访谈类节目主持 主讲:范冰杰.
生物科 陳鳳娟老師.
99年度學生健檢說明簡報.
新高中中國歷史第三次諮詢 公開評核.
结合语义理解的语音识别技术和深度学习技术
导入:找问题 在一个初中课堂上,老师讲了这样一个故事:有三只猎狗追一只土拔鼠,土拔鼠钻进了一个树洞。这只树洞只有一个出口,可不一会儿,从树洞里钻出一只兔子,兔子飞快地向前跑,并爬上一棵大树。兔子在树上,仓皇中没站稳,掉了下来,砸晕了正仰头看的三只猎狗,最后,兔子终于逃脱了。
第二章 继承爱国传统 弘扬民族精神.
活动教学与合作学习
北京铁路电气化学校 心理健康 第四章 学会学习 终身学习 知识点八 实践是培养技能的重要途径 制作人:陈峻殊 德育教研组.
安全生产党政同责与依法治安 常纪文 博士、博士后 国务院发展研究中心资源与环境政策研究所副所长、 研究员 中国社会科学院法学研究所教授 国家安全生产理论专家、原北京市安监局副局长.
報告人:古博文 彰師大運動健康研究所副教授 人權教育基金會執行長 100年8月
科技计划体系 与 科技计划管理 浙江省科技厅综合计划处 二OO九年八月
設計者:台中縣永隆國小 王慶祥 老師 主講者:高雄市光華國小 洪秋龍 主任 日期:2003/11/08
教育社會學 報告者:王柏壽.
第七章 组织结构设计.
全国教育信息技术重大课题“信息技术支持个性化学习”首席专家
臺北市立大直高中 105學年度防震防災演練.
Assessment For Learning
研究中国经济的权威数据库 《中经专网·教育版》数据库介绍
交換生說明會 101學年度下學期 (2013年春季學期) 2013年2月18日 (工程一館106室)
人工智能师资培训:TensorFlow要点
Training Project 05 培训项目 政策市场培训 汽车行业细分市场分析 汽车行业专项政策解读 市场决策流程管理
教學資源中心 簡報人:教學資源中心王志傑主任 教學科技推廣組張彥之組長.
Deep learning 调研.
基于深度学习模型的高效语音识别 推理结构及搜索算法研究 (解码器研究方向) Inference Architecture & Search Optimization for Deep Learning based ASR 姓名:陈哲怀 导师:俞 凯.
期末報告-- [ridge regression]
从美国大选与中共十八大 看我国政治性新闻传播 刘 通.
广义相对论课堂五 尺度收缩
现代教育技术应用 第一章 现代教育技术基础 第6讲 何克抗教授关于多媒体课件的理论研究 单 位: 北京师范大学 作 者: 毛荷&王翠霞.
chapter5員工教育訓練 第一節 教育訓練之意義重要性及方法 第二節 企業大學蔚為風尚 第三節 教育訓練計畫四大程序與對員工學習原則
一.關於美國全球戰略的幾點分析 美國國家安全戰略的目標逐步定位為:保持美國在世界新格局中的領導地位=霸權地位
突旅 Sudden Travel 想不想來一場說走就走的旅途 – - 請開啟投影片播放,給你更優質的介紹 -
Training Project 05 培训项目 政策市场培训 汽车行业细分市场分析 汽车行业专项政策解读 市场决策流程管理
105學年度 服務學習教育說明會 Service Learning.
李宏毅專題 Track A, B, C 的時間、地點開學前通知
聚合型第一種:隱沒帶、島弧 例子:臺灣東方的琉球海溝、南美洲智利海溝. 聚合型第一種:隱沒帶、島弧 例子:臺灣東方的琉球海溝、南美洲智利海溝.
Introduction of this course
Speaker : YI-CHENG HUNG
古佳怡 AI 人工智慧.
組織行為實務專題報告 -別讓抱怨變成顧人怨
指導老師:陳永進老師 朝陽科技大學98學年度第一學期
長 庚 大 學 醫 學 院 醫 學 系 生命科學研究課程說明.
專題式寫作、專題式網頁、專題式研究 Problem—Based Learning(以問題為學習導向)
蜗牛. 蜗牛 周杰伦(Jay Chou),中国台湾流行乐男歌手、音乐人、演员、导演、编剧、监制、商人。 2000年发行首张个人专辑《Jay》。2001年发行的专辑《范特西》。2002年举行The One世界巡回演唱会。2003年登上美国《时代周刊》。2004年获世界音乐大奖中国区最畅销艺人奖。2005年凭借动作片《头文字D》获得台湾电影金马奖、香港电影金像奖最佳新人奖。2006年起连续三年获得世界音乐大奖中国区最畅销艺人奖。2007年自编自导的文艺片《不能说的秘密》获得台湾电影金马奖年度台湾杰出电影奖。2
精進優質 計畫方案 104-1良師甲工精進教學計畫 計畫目標 各教學單位辦理教師增能研習,期能對新課程的架構與 精神有更深一層的認知與準備。
大腦的解題 ─神經網路簡介 陳慶瀚 機器智慧與自動化技術(MIAT)實驗室 義守大學電機系
《神经网络与深度学习》 第10章 模型独立的学习方式
證道:.
Presentation transcript:

欠拟合与过拟合 龙沛洵 2018.9.6

训练误差与泛化误差 误差(error) 训练误差(training error) 泛化误差(generalization error) 学习器的预测输出与样本真实标记的差异 训练误差(training error) 学习器在训练样本集上的误差 泛化误差(generalization error) 学习器在新样本集上的误差 期望目标 得到泛化误差小的学习器 实际做法 使训练误差最小化 训练误差越小是否也意味着泛化误差也越小? 学习器在训练样本上表现好是否也意味着在新样本上表现也好?

欠拟合与过拟合 过拟合(overfitting) 欠拟合(underfitting) 两种情形下学习器的表现 ——周志华《机器学习》 当学习器把训练样本学得“太好”了的时候,很可能已经把训练样本自身 的一些特点当作了所有潜在样本都会具有的一般性质,这就会导致泛化性 能下降。 欠拟合(underfitting) 学习器对训练样本的一般性质尚未学好。 ——周志华《机器学习》 两种情形下学习器的表现 过拟合:学习器在训练样本集上表现得非常好,在新样本集上表现很差 欠拟合:学习器在训练样本集和新样本集上都表现得较差

一个直观类比 ——周志华《机器学习》

另一个例子 训练数据 X Y 1.1 0.7 3.4 0.6 5.6 1.4 5.7 1.7 7.8 10.3 6.5 12.1 9.7 测试数据 X Y 2.3 0.5 6.6 9.1 5.0 11.4 8.5 12.5 10.5

二次多项式模型 训练数据 测试数据 学得的模型: 𝑦 =0.0974 𝑥 2 −0.471𝑥+1.0952 X Yact Ypred 1.1 0.7 0.695 3.4 0.6 0.618 5.6 1.4 1.512 5.7 1.7 1.575 7.8 3.347 10.3 6.5 6.577 12.1 9.7 9.656 在训练数据上的均方误差 Etraining = 0.005602 测试数据 X Yact Ypred 2.3 0.5 0.527 6.6 2.229 9.1 5.0 4.875 11.4 8.5 7.474 12.5 10.5 8.384 学得的模型: 在测试数据上的均方误差 Etest = 0.008059 𝑦 =0.0974 𝑥 2 −0.471𝑥+1.0952

线性模型 训练数据 测试数据 学得的模型: 𝑦 =0.8379𝑥−2.0779 X Yact Ypred 在训练数据上的均方误差 1.1 0.7 -1.156 3.4 0.6 0.771 5.6 1.4 2.614 5.7 1.7 2.698 7.8 4.458 10.3 6.5 6.552 12.1 9.7 8.061 在训练数据上的均方误差 Etraining = 1.3935 测试数据 X Yact Ypred 2.3 0.5 -0.151 6.6 3.452 9.1 5.0 5.547 11.4 8.5 7.474 12.5 10.5 8.396 学得的模型: 在测试数据上的均方误差 Etest = 1.5060 𝑦 =0.8379𝑥−2.0779

六次多项式模型 训练数据 测试数据 学得的模型: X Yact Ypred 在训练数据上的均方误差 Etraining = 0 X Yact 1.1 0.7 3.4 0.6 5.6 1.4 5.7 1.7 7.8 10.3 6.5 12.1 9.7 在训练数据上的均方误差 Etraining = 0 测试数据 X Yact Ypred 2.3 0.5 7.286 6.6 3.714 9.1 5.0 2.271 11.4 8.5 12.956 12.5 10.5 0.210 学得的模型: 在测试数据上的均方误差 Etest = 36.245 𝑦 = −0.0035 𝑥 6 +0.1429 𝑥 5 −2.2506 𝑥 4 +17.42 𝑥 3 −68.141 𝑥 2 +122.56𝑥−71.781

三个模型的比较 过拟合 正确的模型 欠拟合

三个模型的比较 奥卡姆剃刀(Occam’s razor)原则 在上面的例子中,如果使用三次多项式模型,也可以获得较低的训 练误差和泛化误差 Etraining Etest 类型 二次多项式 0.005602 0.008059 正确的模型 线性模型 1.3935 1.5060 欠拟合 六次多项式 36.245 过拟合 在上面的例子中,如果使用三次多项式模型,也可以获得较低的训 练误差和泛化误差 𝑦 =0.0003 𝑥 3 +0.0922 𝑥 2 −0.4438𝑥+1.0633 𝐸 training =0.006058, 𝐸 test =0.004609 奥卡姆剃刀(Occam’s razor)原则 如无必要,勿增实体。 若有多个假设与观察一致,则选择最简单的那个。

应对措施 欠拟合 过拟合 原因:通常是由学习能力不足造成的 解决方法:增加模型复杂度 决策树学习中增加扩展分支 神经网络中增加网络结构复杂度和训练轮数 过拟合 过拟合是机器学习面临的关键障碍,各种学习算法都要包含一些防止过 拟合的措施。 应对措施:增加训练数据数量、控制训练程度 使用更多的数据进行训练 决策树学习中限制决策树的层数 神经网络中限制训练轮数 集成学习中限制基学习器的个数 过拟合是永远无法避免的

为什么深度学习会在近几年火起来? 深度学习(Deep learning) 近年来深度学习成为热门的原因 有很多层的神经网络(“深度”的含义) 神经网络的基本原理与相关算法早在20世纪80年代就已经被提出来了 常见深度学习模型 深层神经网络(DNN), 卷积神经网络(CNN), 循环神经网络(RNN) 近年来深度学习成为热门的原因 计算能力增强使得求解复杂模型成为可能; 数据量大幅增加降低了过拟合的风险; 用户不必关心模型内部的具体工作方式,不必事先假设数据的分布,降 低了机器学习的应用门槛。