第九届机器学习 及其应用研讨会 2011年11月,清华大学 机器学习的困惑 与历史的启示 王珏.

Slides:



Advertisements
Similar presentations
课前寄语 1 、保持纪律 2 、相互配合. 第三节 公民的投资 —— 公民的存款储蓄 课堂导入.
Advertisements

渡黑水溝 郁永河. 2 戎克船:是明末清初時期往返兩岸的主要交通工具 ∗ 1. 關於台灣的開發歷史,我們到底了解多少呢?不妨試著說出 就我們所知有關台灣開發史的故事、小說、電影、音樂與大 家分享。 ∗ 2. 什麼是黑水溝?黑水溝為什麼會成為大陸移民渡海來臺時最 大的威脅? ∗ 3. 有聽過「六死三留一回頭」、「有唐山公,無唐山嬤」這兩.
旅遊實務Ⅰ 授課教師:李健民 上課班級: 320. 課程大綱 旅遊業之設立程序 旅行業組織結構 旅行業之分類 旅行業之管理.
病历书写 中山医院呼吸科 张 新. 定 义 病历是临床医生根据问诊、体格检查、实验 室和其他检查获得的资料经过归纳、分析、整理, 按照规定的格式而写成的;是关于病人发病情况, 病情发展变化,转归和诊疗情况的系统记录。 病历是临床医生根据问诊、体格检查、实验 室和其他检查获得的资料经过归纳、分析、整理,
第十二章 病历书写与要求 病历病历 医务人员在医疗中形成的文字、符号、图表、 影像、切片等资料的总和。 病历书写 通过诊法、诊断、治疗、护理等医疗活动获得有关资 料,进行归纳、分析、整理形成医疗活动记录行为。 病历意义 A 诊疗等的源文件; B 复 / 转 / 会诊,解决医疗纠纷、判定法律责任、医疗保险等的资料和依据;
親 ( 四 ) 親近神的路. 一、親的三字訣、七字訣: 親近神,親愛人; 與主交通親近神,同情關心親愛人。 甚麼是親? 1. 親有親近、親愛,更有關心、同情、親切的 意思。 2. 親的人與人沒有間隔,拉近人與人之間的距 離,並且樂意幫助人,與人相調建造在一起。
第二班群教師團隊 105 張心平 107 鐘于寧 106 黃意評 108 鄭婉茹. 第二班群之班親會說明 學校規定事項說明 教學活動說明 班群活動介紹.
差勤.
申論題要拿高分並不容易,因為他是 有一定的技巧的,如果你遵照下列技 巧來作答申論題,相信高分並不難拿, 其技巧如下:
Artificial Neural Network 人工神经网络.
102大學甄選入學 個人申請、繁星推薦說明 主講人:簡慧嫻.
報告書名:父母會傷人 班級:二技幼四甲 姓名:吳婉如 學號:1A2I0034 指導老師:高家斌
新進教師研習 教務處報告 報告人:教務處 林永仁 2011 年 8 月31日.
「明清時期台灣古典散文」 教師:田啟文.
幼 兒 遊 戲 訪 談 組別:第七組 班級:幼保二甲 姓名:4A0I0008劉俐音 4A0I0043吳碧娟 4A0I0059劉又甄 4A0I0060江佳霓 4A0I0061蕭靖霓 4A0I0079王毓君.
提纲 主要参考书目 AI的基础及萌芽 AI的创立及发展 AI的主要研究范围 国外著名的AI研究机构 AI在中国 AI的最新动态
明清文人集中的寓言 pg359-371 韓佩思 中碩一
新頒解釋函令 ● 所得稅扣(免)繳相關法令、 ● 所得稅扣(免)繳申報實務 ● 扣繳常見稅務違章類型 財政部南區國稅局屏東分局
§2 线性空间的定义与简单性质 主要内容 引例 线性空间的定义 线性空间的简单性质 目录 下页 返回 结束.
歷史建築清水國小宿舍群修復工程 施工說明會
欢迎各位老师莅临指导! 高中一年级生物 授课人:刘敏 授课班级:C332.
鼻炎 症狀: 鼻(眼睛)內發癢或不舒服、 打噴嚏、 流鼻涕(水)、 鼻塞………等 。 鼻子內的任何發炎。
小寶寶家庭保健護理小常識 講師:郭洽利老師
媽,我們真的不一樣 青少年期與中年期 老師: 趙品淳老師 組員: 胡珮玟4A1I0006 馬菀謙4A1I0040
模块七 房地产营销渠道策略 主要内容 房地产营销渠道类型 房地产营销渠道选择方法 开发商与代理商的合作模式.
《女性消费行为与研究方法》 广东外语外贸大学 杨晓燕教授.
2.2.1 等比数列的概念和通项公式.
教材: 王万良《人工智能及其应用》(第2版) 高等教育出版社,
遣詞造句知多少? 中文系 王偉勇教授 兼通識教育中心中心主任.
关于在宝钢全体党员中开展“学党章党规、 学系列讲话,做合格党员”学习教育的 实施方案
(4)理论体系与实训模块 必须衔接、融合 本课程把理论教学体系与实训模块结构连接成一个完整的高职课程体系。
最有利標及評選優勝廠商 講師 劉金龍 經歷:臺中市政府發包科科長.
三、市场营销学研究的基本方法 (1)产品研究法。是以物为中心的研究方法,即在产品分类的基础上,对各类产品市场分别进行研究。 (2)机构研究法。是以研究市场营销制度为出发点,体现以人为中心的研究方法,即集中对整个市场营销系统中的各特定机构的性质和功能进行研究。 (3)职能研究法。是以研究产品从生产者到消费者手中所进行的各种营销活动过程中,市场营销组织所发挥的功能的方法。
宋 弘 仁 計畫主持人 經理 數位學習專案經歷 學歷 專長 經歷 相關證照
班級:二幼三甲 姓名:郭小瑄 、 詹淑評 學號:1A2I0029 、1A2I0025
青春期 要長大囉! 男女有別 生命的誕生~兩性結合才有下一代的新生命 為什麼會有月經? 經痛怎麼辦 ? 渡過快樂青春喜歡自己
鼻 咽 癌 Nasopharyngeal carcinoma, NPC
第五章 病因病机.
指導老師:陳韻如 姓名:吳宜珊 學號:4A0I0911 班級:幼保二乙
台灣的名勝古蹟.
親愛的吉姆舅舅:   今天吃完晚餐後,奶奶說,在家裡情況變好以前,您要我搬到城裡跟您住。奶奶有沒有跟您說,爸爸已經好久沒有工作,也好久沒有人請媽媽做衣服了?   我們聽完都哭了,連爸爸也哭了,但是媽媽說了一個故事讓我們又笑了。她說:您們小的時候,她曾經被您追得爬到樹上去,真的嗎?   雖然我個子小,但是我很強壯,只要我會做的我都可以幫忙,但是,奶奶說,做其他事情以前,要先把功課做完。
网络的利与弊 2017/3/19 该课件由【语文公社】
2017/3/20 第3章: 弹性与政策分析.
研究發展處 業務簡報 報 告 人:國立高雄餐旅大學 張明旭 研發長 中華民國105年4月14日.
第十九课 南吕•一枝花 不 伏 老 关汉卿.
最有利標及評選優勝廠商 講師 劉金龍 經歷:臺中市政府發包科科長.
傳統童玩遊戲創新 組別:第八組 班級:幼保二甲 組員: 4A0I0005柯舒涵 4A0I0011謝孟真
台灣史總複習.
當 家 新 鮮 事.
國文報告 儒家生死文化討論 不死鳥 組員 972BP001 彭科強 972BP008 王薪榕 972BP025 彭裕宗
兒童及少年福利服務 講師:張智昇.
人工智能 上海交通大学计算机系 卢 宏 涛 2003年9月.
第三部分 动作与技能实验 实验一 反应时实验 实验二 反应时运动时实验 实验三 敲击速度实验 实验四 动作稳定性实验 实验五 手指灵活性实验
人工神经网络方法简介. 人工神经网络方法介绍 b 概况 b 原理及计算方法 b 气象中的应用.
中國美術史報告-我最喜歡的一幅畫 班級:2年2班 姓名:郭馥甄 座號:23.
高鐵炫風 製作人林淑蘭老師.
行政院勞工委員會勞工保險局 勞退舊制與新制分析說明 高雄市政府人事處 99年2月1日.
2007/5/23初訪螢光蕈 (等了兩年).
第三章 生物神經網路 與類神經網路 類神經網路 台大生工系水資源資訊系統研究室.
姓名:何康綸 學號:M 指導教授:楊朝平 博士
开始 结束.
传感器网络数据融合技术研究 张小波 广东工业大学自动化学院网络工程系
第十一章 套利定价模型 第一节 因素模型: 单因素模型和多因素模型 第二节 套利定价理论:
人工智慧:學習.
机器学习-贝叶斯学习 作者:Mitchell 译者:曾华军等 讲者:陶晓鹏
第三章 世界文明的蛻變與互動 第一節 歐洲社會的蛻變 第二節 世界文明的交匯 第三節 亞洲大帝國的發展 1.
CYC遊戲大聯盟網路行銷-- 各版位與價目表 群想網路科技股份有限公司.
高雄區12年國教入學方式 報告人:高雄市政府教育局 局長 鄭新輝.
神经网络 Statistical Learning 方匡南 厦门大学教授 博士生导师.
数列求和 Taojizhi 2019/10/13.
Presentation transcript:

第九届机器学习 及其应用研讨会 2011年11月,清华大学 机器学习的困惑 与历史的启示 王珏

统计机器学习的麻烦 自 然 模 型 [采样] 统计机器学习 样本集 [算法] [交叉验证] 模型 [设计实验] 假设iid ????? 特殊函数的逼近 [设计实验] 如果数据不充分,在大变量集合下,如何设计实验,获得新数据。 问题:模型是自然模型吗? 统计机器学习的困难:实验设计存在组合问题。iid成为与自然模型无关的假设!

社会的需求 生物、网络、金融、经济和安全等众多领域,大变量集合的海量数据不断涌出,社会迫切需要分析与处理这些数据的有效理论、方法与技术。 寻找分析与处理大变量集合海量数据的新理念、理论、方法与技术成为当前迫切的任务。

历史的故事

线性感知机 1902年,James的神经元相互连接 1943年,McCulloch和Pitts的神经元工作方式 1949年,Hebb的学习律。 基于最小二乘的Rosenblatt的感知机(1956),其本质是多变量空间上的平均(回归)。 基函数: L = 1D + 2I + 3G + 4S 设计算法,确定,获得模型 贡献是:多变量回归的计算方法(神经网络)。 疑问是:只能解决线性问题,不能满足实际的需要。埋下被批评的口实。

20世纪70年代面临的选择 选择 统计优化(平均): 线性感知机 统计模式识别 复杂信息系统(结构): 专家系统 句法模式识别 非线性问题 Duda and Hart[73] If [D=0][G=A] then[L=0] If [I=0][G=A] then[L=0] If [D=1][I=1][G=A] then [L=1] 从Bayes判别(分类),引入损失函数,变为正则化问题 选择 非线性问题 计算效率 专家系统合理 复杂问题求解 实现智能系统的理想

AI 1956年,以复杂信息处理为契机,提出AI。其动机有二:其一,发展处理符号的方法,其二,处理非线性问题。 1969年,M.Minsky发表颠覆性的报告, “Perceptron”。表象是以XOR问题向以平均为基础的感知机发难,本质是试图以结构方法代替平均。全书使用拓扑作为工具。 过分强调独立性,使得描述任何一个问题,需要穷举出所有可能。80年代,耗资巨大的CYC“失败”了。 需要统计方法成为共识。

20世纪80年代面临的选择 选择 结构学习的困难 字符识别,网络数据建模 先验的结构 误差界指导算法设计 先验概率分布 算法基于线性感知机 概率图模型(Bayes学派): Markov随机场 Bayes网 人工神经网络(频率学派): BP 统计机器学习 Gibbs[1902], Wright[1935] Clifford[1971] Pearl[1988,89] 选择 结构学习的困难 先验的结构 先验概率分布 推断是NPC 字符识别,网络数据建模 误差界指导算法设计 算法基于线性感知机 无需先验知识,无推断 考虑泛化为核心

统计机器学习 从ANN到SML,发展得力于对字符识别的成功 神经网络基于PAC的机器学习基于统计学的机器学习 1986年, Remulhart发表PDP报告,包含非线性BP算法,解决XOR,逼近非线性函数。学术价值不大,人们开始重新尝试“平均”方法。 1991年,Vapnik借用在AI中的PAC,给出基于iid的误差界,基于PAC的统计开始成为主流 贡献: (1)基于iid的误差界指导算法设计,(2)算法设计返回感知机,线性算法,寻找线性空间(核映射)。 基于PAC理论,误差界以1-概率成立。这个参数在泛化意义下的解释:理想,应该趋于0,但是,误差界将趋于无穷,成为平凡界。 新世纪开始,统计学家加入SML,完全放弃PAC(Hastie)。 从ANN到SML,发展得力于对字符识别的成功

维数灾难 由于困难具有本质性,平均遇到大麻烦! 在高维空间(成百上千)建模,最大的危险就是空间大的程度使得再多的样本,在这个空间上也是稀疏的。 高维空间上的统计理论,多重积分是麻烦,补充“合适”样本是麻烦。“同分布”只能停留在假设上,无法实施。 由于困难具有本质性,平均遇到大麻烦!

概率图模型 结构(全局) + 平均(局部) 将问题考虑为求解Bayes问题 基于平均的研究已经过去20余年,2009年,Koller出版巨著(近1200页),概率图模型。 结构(全局) + 平均(局部) 将平均放在局部,避免了维数灾问题,同时保证了泛化和模型的可解释性,关键是结构,将局部的平均构造起来。 将问题考虑为求解Bayes问题

概率图模型的三个要素 一、表示 二、推断 三、学习

表示---I-map I-map={ DI L  I L  D S  D S  G S  L } P(I,D,G,L,S)= P(G|I,D) P(L|G) P(S|I) P(I) P(D | I) I与D相互独立 P(G | I, D) P(L | I, D, G) L只与G有关,与其他独立 P(S | I, D, G, L) S只与I有关,与其他独立 P(D, I)=P(D)P(I) P(L, I|G)=P(L|G)P(I|G) P(L, D|G)=P(L|G)P(D|G) I-map={ DI L  I L  D S  D S  G S  L }

求解Bayes问题的策略 使用Markov网表示Bayes问题。 (1)连接的节点保持连接。(2)X与Y有共同子孙,X与Y连接。 由于Bayes网可以简单地转化为Markov网,因此,在统计上,这个方法可以归入Bayes范畴,Markov网成为求解Bayes问题的一个方法。 求解Bayes问题有两个途径:(1)直接求解,困难;(2)变换为Markov网,使用优化方法求解。(与Duda & Hart的思考一致)。

计算是NPC问题(或多重积分,Bayes问题)。 推断,概率查询(Y边缘):根据给定图,计算P(Y | E = e)。在证据E=e条件下,Y出现的概率(边缘概率)。 (1)根据给定BN,计算联合分布:P() =  P(Xi | PaXi) (2)计算在E下变量Y的边缘分布:P(Y | E) = X-{Y}-EP() 计算是NPC问题(或多重积分,Bayes问题)。 求解Bayes问题的两条路线(Duda(1973), Koller(2009)): (1)直接求解:动态规划、Clique树,蒙特卡洛等。 (2)变分求解:设定目标函数(损失),化为正则化问题。

学习 假设:给定结构且样本完整(所有变量被赋值)。 任务:学习参数,参数估计。CPD 方法:(1)最大似然估计, (2)Bayes预测 假设:结构未知,但是,样本完整。 任务:学习结构和参数。 考虑一个可能结构的假设空间,结构选择变为优化问题。 假设:样本不完整,或某些变量未知。 任务:发现非显现表现的变量,知识发现。

更为重要的是:通过知识库建立结构(或减小假设空间)。 学习结构的两种策略 假设空间:对结构,就是变量连接的全组合。 A 学习结构:根据某种准则,求出I-map I(G)={A  B} I(G)={A  C} I(G)={A  E} B C I(G)={A  E,B  E, C  D, A  C} 准则:对某个结构的评价---评分。 目标:从假设空间中选择似然最大的模型(结构和参数) D E 更为重要的是:通过知识库建立结构(或减小假设空间)。

历史进程---20年河东,20年河西? M. Minsky等 1943-1969 平均(数值计算) 感知机 1956-1986 Perceptrons: An introduction to computational geometry. 1969 1943-1969 平均(数值计算) 感知机 1956-1986 结构(符号计算) 人工智能 D. Rumelhart等, Parallel Distributed Processing, 1986 V. Vapnik, The nature of statistical learning theory, 1995 T.Hastie等, The Elements of Statistical Learning, 2003 2000-今后 平均+结构? 概率图模型? D. Koller等 Probabilistic Graphical Models: Principles and Techniques, 2009 1986-今天 平均(数值计算) 统计机器学习

总结:我们的纠结 统计机器学习以“泛化”为核心。 泛化:大量不确定观察的平均是确定的,排中。iid 难以割舍: (1)大量实际问题需要建立的模型是可泛化的; (2)泛化使得建立的模型是实际问题有依据的近似; (3)不知什么新的标准可以代替泛化。 Koller这本书并没有以泛化为核心,她的宗旨与AI相似。

概率图模型为“描述”与“描述后的预测”提供基础。 前途:“预测”与“描述” 预测与描述是数据挖掘提出的两个任务,但是,数据挖掘的描述任务一直开展不好(啤酒和尿布)。被嘲笑! 图模型既可以消除噪音且表示紧凑(相对AI的穷举),还可以对模型的各个部分可解释。前者是预测(泛化),后者是描述(发现)。 金融和生物等领域,计算机科学有两个策略:其一,代替领域专家(从数据建立可靠(泛化)的模型),其二,为领域提供工具,简化专家的工作(知识发现)。对这些领域,描述可能更好。对网络、语言、图像等领域,泛化是重要的,但是,发现同样重要。 概率图模型为“描述”与“描述后的预测”提供基础。

愚者浅谈,不足为凭 痴人梦语,切勿轻信 旧路沿袭,艰难度日 新盘洞察,激动人心 谢 谢