机器学习-概念学习 作者:Mitchell 译者:曾华军等 讲者:陶晓鹏

Slides:



Advertisements
Similar presentations
李时珍,明朝杰出的医学家和 药物学家。其父是当地名医。 李时珍继承家学,在长期的行 医过程中,他发现以往的本草 书有不少错误,于是立下了重 修本草书的宏愿。在近30年 的时间,他三易其稿,完成了 《本草纲目》这部药物学巨著 的编定。
Advertisements

猜谜语 有个小娃娃,真是没 礼貌。 见到小树摇一摇,吓 得树叶哇哇叫。 见到小花逗一逗,摘 去她的太阳帽。 没人和它交朋友,只 好自已到外处跑。
早自修課推動班級家長說故事及 經驗分享活動。 寒假親師生戶外參訪 ~ 原鄉文化、田園野趣學 習之旅 ~ 造訪鍾理和紀 念館、文學步道。親師生戶外參訪.
手动换页 域外风情系列 儿子去美国留学,毕业后定居美国。还给我找了 个洋媳妇苏珊。如今,小孙子托比已经 3 岁了。 今年夏天,儿子为我申请了探亲签证。在美国待 了三个月,洋媳妇苏珊教育孩子的方法,令我这 个中国婆婆大开眼界。
海伦深深地感激自己的老师, 她说:假如给我三天光明,我 首先要长久地凝视我的老师 — — 安妮 · 莎莉文 !
第七章 获利能力分析. 第一节 获利能力分析概述 获利能力的内涵 获利能力(盈利能力)是指企业获取利润的能力。 评价方法: ①利润与销售收入之间的比率 ②利润与资产之间的比率.
99學年度第1學期導師輔導工作座談會 全校性共同必修服務學習課程 報告單位:學務處領導知能與服務學習中心.
智慧城.
月子保姆理论知识试卷.
黄帝内经 内经教研室 王黎.
4月2日是安徒生诞辰200周年纪念日,世界各国的读者以各种各样的方式怀念这位给儿童带来感动和快乐的童话巨人。
窦娥冤 关汉卿 感天动地 元·关汉卿.
報告書名:父母會傷人 班級:二技幼四甲 姓名:吳婉如 學號:1A2I0034 指導老師:高家斌
台北市立聯合醫院南軟門診部 皮膚科醫師簡介 溫素瑩醫師 學經歷: 中山醫學院醫學系畢業 台北醫學大學醫學資訊研究所碩士
职官与科举 职官:在国家机构中担任一定职务的官吏,这里面有职官的名称、职权范围和品级地位等方面的内容。
花开有日 芬芳天下 “国培计划(2012)” ——幼儿园骨干教师远程培训项目 山东幼儿园教师8班第4期简报 主办人:张瑞美     
皇帝的新装.
《卖火柴的小女孩》 《海的女儿》 你 认 识 这 些 图 片 的 故 事 吗 《丑小鸭》 《拇指姑娘》 它们都来自于哪位作家笔下?
會計資訊系統 專章A.
第三章 調整與編表.
民主國家的政府體制 我國的中央政府體制 我國中央政府的功能 地方政府組織與功能
媽,我們真的不一樣 青少年期與中年期 老師: 趙品淳老師 組員: 胡珮玟4A1I0006 馬菀謙4A1I0040
品读论语之四---- 巧言令色非君子.
知其不可而为之.
中国画家协会理事、安徽省美术家协会会员、 工艺美术师、黄山市邮协常务理事余承平主讲
銷售與顧客關係管理 巫立宇.邱志聖 著.
20、豆花庄的小家伙们.
TALK ABOUT 数据挖掘-十大经典法 QianShi Li-Design
系統分析與設計 系級:資管三B 姓名:朱秋儒 學號:
防制學生藥物濫用 高雄市教育局校外分會 林永興教官.
班級:二幼三甲 姓名:郭小瑄 、 詹淑評 學號:1A2I0029 、1A2I0025
CH11 心理疾病 李志鴻.
华 夏 之 祖 第 3 课.
法學緒論第六單元:法律適用 設計課程︰ 財經法律系 --楊東連 法學緒論-6.
指導老師:陳韻如 姓名:吳宜珊 學號:4A0I0911 班級:幼保二乙
汉字的构造.
诵读欣赏 古代诗词三首.
古今异义 漳州一中 黄安娜.
一言之辩强于九鼎之宝 三寸之舌胜于百万雄师
24最后一分钟 武都区外纳中心小学 梁晓玲 乌鲁木齐县 青格达湖中学 方梦辉.
CH1 . 集 合 与 命 题.
傳統童玩遊戲創新 組別:第八組 班級:幼保二甲 組員: 4A0I0005柯舒涵 4A0I0011謝孟真
师说 韩 愈.
現代文學導讀 ─ 盧新華 傷痕 組 員:林于翔 4A1L0084
济南的冬天 老 舍 周至县辛家寨中学 王菊文.
2009年 初夏 某天 我 一個人 一輛車 計劃 沒有計劃 只想 漫無目的 到處亂晃 感覺夏天的散漫.
Ch19 創業精神 管理學:整合觀點與創新思維3/e.中山大學企管系 著.前程文化 出版.
班級:夜師資一甲 指導老師:蘇國榮老師 姓名:929201林佑蓉 石依縈 李玉玫 桂秀媛
以考试说明带动二轮复习 福州第三中学 张璐.
天净沙·秋思 马致远 枯藤老树昏鸭, 小桥流水人家, 古道西风瘦马。 夕阳西下, 断肠人在天涯。.
贴近教学 服务师生 方便老师.
六年级 语文 下册 第四单元 指尖的世界.
(浙教版)四年级品德与社会下册 共同生活的世界 第四单元 世界之窗 第二课时.
游子心 中华情 美国大华府地区华人华侨 庆祝中国六十周年华诞.
跨越海峡的生命桥.
奇妙的克隆 谈家桢.
与妻书 林觉民.
常用資料採礦技術介紹 關聯分組(associations)、分類(classification)、時序相關(sequence)、預測(forecasting)、群集化(clustering)以及描述等分析作業,目前常用的資料採礦技術有決策樹、類神經網路、基因演算法以及即時線上分析(OLAP)
小 学 语 文 二 年 级 下 册 第 一单 元.
今天是几月?几日?.
飯店業的介紹.
Course 4 分類與預測 Classification and Prediction
選擇勞退新制,終身免煩惱 勞工退休金新制 說明會.
CH12-物流中心.
机器学习-贝叶斯学习 作者:Mitchell 译者:曾华军等 讲者:陶晓鹏
設計者:台中市重慶國小 張祐榕.楊晟汶.張儷齡
2009年 初夏 某天 我 一個人 一輛車 計劃 沒有計劃 只想 漫無目的 到處亂晃 感覺夏天的散漫 按鍵換頁--輕音樂欣賞.
Xián 伯 牙 绝 弦 安徽淮南市八公山区第二小学 陈燕朵.
第四章 買賣業會計.
績優教師分享 美容保健科 林品瑄 教師.
Presentation transcript:

机器学习-概念学习 作者:Mitchell 译者:曾华军等 讲者:陶晓鹏 第2章 概念学习和一般到特殊序 2003.12.18 机器学习-概念学习 作者:Mitchell 译者:曾华军等 讲者:陶晓鹏

机器学习-概念学习 作者:Mitchell 译者:曾华军等 讲者:陶晓鹏 提纲 概念学习 给定某一类别的若干正例和反例,从中获得该类别的一般定义。 搜索的观点 在预定义的假设空间中搜索假设,使其与训练样例有最佳的拟合。 利用假设空间的偏序结构 算法收敛到正确假设的条件 归纳学习的本质,从训练数据中泛化的理由 2003.12.18 机器学习-概念学习 作者:Mitchell 译者:曾华军等 讲者:陶晓鹏

机器学习-概念学习 作者:Mitchell 译者:曾华军等 讲者:陶晓鹏 简介 许多机器学习涉及到从特殊训练样例中得到一般概念。 概念,可被看作一个对象或事件集合,它是从更大的集合中选取的子集,或在这个较大集合中定义的布尔函数。 概念学习问题的定义 给定一个样例集合以及每个样例是否属于某个概念的标注,怎样推断出该概念的一般定义。又称从样例中逼近布尔函数。 概念学习是指从有关某个布尔函数的输入输出训练样例中推断出该布尔函数。 2003.12.18 机器学习-概念学习 作者:Mitchell 译者:曾华军等 讲者:陶晓鹏

机器学习-概念学习 作者:Mitchell 译者:曾华军等 讲者:陶晓鹏 概念学习任务 一个例子 目标概念,Aldo进行水上运动的日子,表示为布尔函数EnjoySport 任务目的,基于某天的各属性,预测EnjoySport的值 一个样例集,每个样例表示为属性的集合 2003.12.18 机器学习-概念学习 作者:Mitchell 译者:曾华军等 讲者:陶晓鹏

概念学习任务(2) 表2-1 目标概念EnjoySport的训练样例 Example Sky AirTemp Humidity Wind Water Forecast EnjoySport 1 Sunny Warm Normal Strong Warm Same Yes 2 Sunny Warm High Strong Warm Same Yes 3 Rainy Cold High Strong Warm Change Yes 4 Sunny Warm High Strong Cool Change Yes 2003.12.18 机器学习-概念学习 作者:Mitchell 译者:曾华军等 讲者:陶晓鹏

机器学习-概念学习 作者:Mitchell 译者:曾华军等 讲者:陶晓鹏 概念学习任务(3) 表示假设的形式 一个简单的形式,实例的各属性约束的合取式 令每个假设为6个约束(或变量)的向量,每个约束对应一个属性可取值范围,为 ?任意本属性可接受的值 明确指定的属性值  不接受任何值 假设的例子 <?, Cold, High, ?, ?, ?> <?, ?, ?, ?, ?, ?> // 所有的样例都是正例 < , , , , , > // 所有的样例都是反例 2003.12.18 机器学习-概念学习 作者:Mitchell 译者:曾华军等 讲者:陶晓鹏

机器学习-概念学习 作者:Mitchell 译者:曾华军等 讲者:陶晓鹏 概念学习任务(4) EnjoySport概念学习任务 已知 实例集X 每个实例x由6个属性描述,每个属性的取值范围已确定 假设集H 每个假设h描述为6个属性的取值约束的合取 目标概念c 一个布尔函数,变量为实例 训练样例集D 目标函数(或目标概念)的正例和反例 求解 H中的一假设h,使对于X中任意x,h(x)=c(x) 2003.12.18 机器学习-概念学习 作者:Mitchell 译者:曾华军等 讲者:陶晓鹏

机器学习-概念学习 作者:Mitchell 译者:曾华军等 讲者:陶晓鹏 术语定义 实例x 实例集X 概念 目标概念c 训练样例x 训练样例集D 正例,目标概念成员 反例,非目标概念成员 假设h 假设集H 机器学习的目标就是寻找一个假设h,使得对所有的h,都有h(x)=c(x) 2003.12.18 机器学习-概念学习 作者:Mitchell 译者:曾华军等 讲者:陶晓鹏

机器学习-概念学习 作者:Mitchell 译者:曾华军等 讲者:陶晓鹏 归纳学习假设 什么是归纳学习? 从特殊的样例得到普遍的规律 归纳 只能保证输出的假设能与训练样例相拟合 归纳假设的一个基本假定 对于未见实例最好的假设就是与训练数据最佳拟合的假设 归纳学习假设 任一假设如果在足够大的训练样例集中很好地逼近目标函数,它也能在未见实例中很好地逼近目标函数。 2003.12.18 机器学习-概念学习 作者:Mitchell 译者:曾华军等 讲者:陶晓鹏

机器学习-概念学习 作者:Mitchell 译者:曾华军等 讲者:陶晓鹏 作为搜索的概念学习 概念学习可以看作一个搜索的过程 搜索范围:假设的表示所隐含定义的整个空间 搜索目标:能够最好地拟合训练样例的假设 当假设的表示形式选定后,那么就隐含地为学习算法确定了所有假设的空间 例子EnjoySport的假设空间 2003.12.18 机器学习-概念学习 作者:Mitchell 译者:曾华军等 讲者:陶晓鹏

机器学习-概念学习 作者:Mitchell 译者:曾华军等 讲者:陶晓鹏 假设的一般到特殊序 假设的一般到特殊序关系 考虑下面两个假设 h1=<sunny, ?, ?, Strong, ?, ?> h2=<Sunny, ?, ?, ?, ?, ?> 任何被h1划分为正例的实例都会被h2划分为正例,因此h2比h1更一般。 利用这个关系,无需列举所有假设,就能在无限的假设空间中进行彻底的搜索 2003.12.18 机器学习-概念学习 作者:Mitchell 译者:曾华军等 讲者:陶晓鹏

机器学习-概念学习 作者:Mitchell 译者:曾华军等 讲者:陶晓鹏 假设的一般到特殊序(2) 关系“更一般”的精确定义 任给实例x和假设h,说x满足h,当且仅当h(x)=1 令hj和hk是在X上定义的布尔函数,称hj比hk更一般,当且仅当(xX)[(hk(x)=1)(hj(x)=1)] 记为hj more_general_than_or_equal_to hk,或hj g hk 2003.12.18 机器学习-概念学习 作者:Mitchell 译者:曾华军等 讲者:陶晓鹏

机器学习-概念学习 作者:Mitchell 译者:曾华军等 讲者:陶晓鹏 假设的一般到特殊序(3) “更一般”的严格情形 hj >g hk,当且仅当,(hj g hk) (hk g hj) “更特殊”关系的定义 hj g hk,当且仅当,hk g hj 以EnjoySport为例说明上面的定义 偏序的特点(区别于全序),全序上的搜索可以是二分法,偏序的搜索比无序简单,比全序复杂。 这个偏序关系的定义与目标概念无关 2003.12.18 机器学习-概念学习 作者:Mitchell 译者:曾华军等 讲者:陶晓鹏

机器学习-概念学习 作者:Mitchell 译者:曾华军等 讲者:陶晓鹏 Find-S:寻找极大特殊假设 使用more_general_than偏序的搜索算法 从H中最特殊假设开始,然后在假设覆盖正例失败时将其一般化 表2-3 Find-S算法 将h初始化为H中最特殊假设 对每个正例x 对h的每个属性约束ai 如果x满足ai 那么不做任何处理 否则将h中ai替换为x满足的另一个更一般约束 输出假设h 2003.12.18 机器学习-概念学习 作者:Mitchell 译者:曾华军等 讲者:陶晓鹏

机器学习-概念学习 作者:Mitchell 译者:曾华军等 讲者:陶晓鹏 Find-S:寻找极大特殊假设(2) Find-S算法在例子EnjoySport上的应用 h<, , , , , > h<Sunny, Warm, Normal, Strong, Warm, Same> h<Sunny, Warm, ?, Strong, Warm, Same> 遇到反例,h不变(因为h已经能够正确地识别反例) h<Sunny, Warm, ?, Strong, ?, ?> 2003.12.18 机器学习-概念学习 作者:Mitchell 译者:曾华军等 讲者:陶晓鹏

机器学习-概念学习 作者:Mitchell 译者:曾华军等 讲者:陶晓鹏 Find-S:寻找极大特殊假设(3) Find-S算法演示了一种利用more_general_than偏序来搜索假设空间的方法,沿着偏序链,从较特殊的假设逐渐转移到较一般的假设。因此,每一步得到的假设都是在那一点上与训练样例一致的最特殊的假设。 Find-S的重要特点:对以属性约束的合取式描述的假设空间H,保证输出为H中与正例一致的最特殊的假设。 存在的问题 是否收敛到了正确的目标概念? 为什么要用最特殊的假设? 训练样例是否相互一致? 如果有多个极大特殊假设怎么办? 2003.12.18 机器学习-概念学习 作者:Mitchell 译者:曾华军等 讲者:陶晓鹏

机器学习-概念学习 作者:Mitchell 译者:曾华军等 讲者:陶晓鹏 变型空间和候选消除算法 候选消除算法概说 概念学习的另一种方法,候选消除算法(candidate-elimination) Find-S算法的不足,输出的假设只是H中能够拟合训练样例的多个假设中的一个 候选消除算法输出与训练样例一致的所有假设的集合 候选消除算法在描述这一集合时不需要明确列举所有成员 利用more_general_than偏序结构,可以维护一个一致假设集合的简洁表示 候选消除算法的应用,化学质谱分析、启发式搜索的控制规则 候选消除算法的缺点,容错性能差 2003.12.18 机器学习-概念学习 作者:Mitchell 译者:曾华军等 讲者:陶晓鹏

机器学习-概念学习 作者:Mitchell 译者:曾华军等 讲者:陶晓鹏 变型空间和候选消除算法(2) “一致”的定义 一个假设h与训练样例集合D一致,当且仅当对D中每一个样例<x,c(x)>都有h(x)=c(x),即Consistent(h,D)(<x,c(x)>D)h(x)=c(x) “一致”与“满足”的关系 变型空间(version space) 与训练样例一致的所有假设组成的集合 表示了目标概念的所有合理的变型 关于H和D的变型空间,记为VSH,D,是H中与训练样例D一致的所有假设构成的子集VSH,D={hH|Consistent(h,D)} 2003.12.18 机器学习-概念学习 作者:Mitchell 译者:曾华军等 讲者:陶晓鹏

机器学习-概念学习 作者:Mitchell 译者:曾华军等 讲者:陶晓鹏 变型空间和候选消除算法(3) 列表后消除算法 表示变型空间的一种方法是列出其所有成员 变型空间包含H中所有假设的列表 对每个训练样例<x,c(x)>,从变型空间中移除所有h(x)c(x)的假设 输出Version Space中的假设列表 优点 保证得到所有与训练数据一致的假设 缺点 非常繁琐地列出H中的所有假设,大多数实际的假设空间无法做到 2003.12.18 机器学习-概念学习 作者:Mitchell 译者:曾华军等 讲者:陶晓鹏

机器学习-概念学习 作者:Mitchell 译者:曾华军等 讲者:陶晓鹏 变型空间和候选消除算法(4) 变型空间的更简洁表示 变型空间被表示为它的极大一般和极大特殊的成员 这些成员形成了一般和特殊边界的集合,这些边界在整个偏序结构中划分出变型空间 以EnjoySport为例 2003.12.18 机器学习-概念学习 作者:Mitchell 译者:曾华军等 讲者:陶晓鹏

机器学习-概念学习 作者:Mitchell 译者:曾华军等 讲者:陶晓鹏 变型空间和候选消除算法(5) 形式化定义 极大一般 极大特殊 关于假设空间H和训练数据D的一般边界G,是在H中与D相一致的极大一般成员的集合 关于假设空间H和训练数据D的特殊边界S,是在H中与D相一致的极大特殊成员的集合 2003.12.18 机器学习-概念学习 作者:Mitchell 译者:曾华军等 讲者:陶晓鹏

机器学习-概念学习 作者:Mitchell 译者:曾华军等 讲者:陶晓鹏 变型空间和候选消除算法(6) 变型空间表示定理,令X为一任意的实例集合,H为X上定义的布尔假设的集合。令c: X{0,1}为X上定义的任一目标概念,并令D为任一训练样例集合{<x,c(x)>}。对所有的X, H, c, D以及良好定义的S和G: VSH,D={hH|(sS)( gG)(gghgs)} 证明:只需证明:1)每一个满足上式右边的h都在VSH,D中,2)VSH,D的每个成员都满足都满足等式右边。… 2003.12.18 机器学习-概念学习 作者:Mitchell 译者:曾华军等 讲者:陶晓鹏

机器学习-概念学习 作者:Mitchell 译者:曾华军等 讲者:陶晓鹏 变型空间和候选消除算法(7) 候选消除算法 初始化G和S 如果d是一个正例 从G中移去所有与d不一致的假设 对S中每个与d不一致的假设s 从S中移去s 把s的所有的极小泛化式h加入到S中,其中h满足 h与 d一致,而且G的某个成员比h更一般 如果d是一个反例 从S中移去所有与d不一致的假设 对G中每个与d不一致的假设g 从G中移去g 把g的所有的极小特殊化式h加入到G中,其中h满足 h与d一致,而且S的某个成员比h更特殊 从G中移去所有这样的假设:它比G中另一个假设更特殊 2003.12.18 机器学习-概念学习 作者:Mitchell 译者:曾华军等 讲者:陶晓鹏

机器学习-概念学习 作者:Mitchell 译者:曾华军等 讲者:陶晓鹏 变型空间和候选消除算法(8) 算法举例 2003.12.18 机器学习-概念学习 作者:Mitchell 译者:曾华军等 讲者:陶晓鹏

机器学习-概念学习 作者:Mitchell 译者:曾华军等 讲者:陶晓鹏 变型空间和候选消除的说明 候选消除算法收敛到正确的假设 训练样例中没有错误 H中确实包含描述目标概念的正确假设 如果样例中存在错误 如果给定足够的训练数据,我们会发现S和G边界收敛得到一个空的变型空间 如果目标概念不能由假设表示方式所描述 相似情况出现 2003.12.18 机器学习-概念学习 作者:Mitchell 译者:曾华军等 讲者:陶晓鹏

机器学习-概念学习 作者:Mitchell 译者:曾华军等 讲者:陶晓鹏 变型空间和候选消除(2) 下一步需要什么样的训练样例 一般来说,概念学习的最优查询策略,是产生实例以满足当前变型空间中大约半数的假设。这样,变型空间的大小可以在遇到每个新样例时减半,正确的目标概念就可在只用log2|VS|次实验后得到。 2003.12.18 机器学习-概念学习 作者:Mitchell 译者:曾华军等 讲者:陶晓鹏

机器学习-概念学习 作者:Mitchell 译者:曾华军等 讲者:陶晓鹏 变型空间和候选消除(3) 怎样使用不完全学习概念 虽然图2-3的变型空间中仍包含多个假设,即目标概念还未学习到,但是仍然有可能对新样例进行一定可信度的分类。 表2-6的例子 2003.12.18 机器学习-概念学习 作者:Mitchell 译者:曾华军等 讲者:陶晓鹏

机器学习-概念学习 作者:Mitchell 译者:曾华军等 讲者:陶晓鹏 归纳偏置 有关候选消除算法的几个问题 如果目标概念不在假设空间中怎么办? 是否可设计一个包含所有假设的空间来解决这一困难? 假设空间的大小对于算法推广到未见实例的能力有什么影响? 假设空间的大小对所需训练样例的数量有什么影响? 2003.12.18 机器学习-概念学习 作者:Mitchell 译者:曾华军等 讲者:陶晓鹏

机器学习-概念学习 作者:Mitchell 译者:曾华军等 讲者:陶晓鹏 归纳偏置(2) 一个有偏的假设空间 在EnjoySport这个例子中,假设空间限制为只包含属性值的合取。(有偏) 这一限制,导致假设空间不能够表示最简单的析取形式的目标概念。 2003.12.18 机器学习-概念学习 作者:Mitchell 译者:曾华军等 讲者:陶晓鹏

机器学习-概念学习 作者:Mitchell 译者:曾华军等 讲者:陶晓鹏 归纳偏置(3) 无偏的学习器 为了保证目标概念在假设空间中,需要提供一个假设空间,它能表达所有的可教授概念。换言之,它能表达实例集X的所有子集。 问题:为什么2.3节中合取假设空间只能表示973个假设? 2003.12.18 机器学习-概念学习 作者:Mitchell 译者:曾华军等 讲者:陶晓鹏

机器学习-概念学习 作者:Mitchell 译者:曾华军等 讲者:陶晓鹏 归纳偏置(4) EnjoySport的无偏形式 带来的问题:概念学习算法无法从训练样例中泛化。 要想获得单个目标概念,就必须提供X中所有实例作为训练样例 使用2.6.3节讨论的部分学习的无效 2003.12.18 机器学习-概念学习 作者:Mitchell 译者:曾华军等 讲者:陶晓鹏

机器学习-概念学习 作者:Mitchell 译者:曾华军等 讲者:陶晓鹏 归纳偏置(5) 无偏学习的无用性 归纳学习的一个基本属性:学习器如果不对目标概念的形式做预先的假定,它从根本上无法对未见实例进行分类 归纳学习需要的预先假定,称为归纳偏置 2003.12.18 机器学习-概念学习 作者:Mitchell 译者:曾华军等 讲者:陶晓鹏

机器学习-概念学习 作者:Mitchell 译者:曾华军等 讲者:陶晓鹏 归纳偏置(6) 归纳偏置的精确定义 (Dcxi)L(xi,Dc) 需要在Dcxi上附加怎样的前提,以使L(xi,Dc) 能够演绎派生。 L的归纳偏置定义为前提集合B,使所有的新实例满足: (BDcxi)L(xi,Dc) 考虑对于实例集合X的概念学习算法L。令c为X上定义的任一概念,并令Dc为c的任意训练样例集合,L(xi,Dc) 表示经过Dc训练后L赋予实例xi的分类。L的归纳偏置是最小断言集合B,它使任意目标概念c和相应的训练样例Dc满足: xiX[(BDcxi)L(xi,Dc)] 2003.12.18 机器学习-概念学习 作者:Mitchell 译者:曾华军等 讲者:陶晓鹏

机器学习-概念学习 作者:Mitchell 译者:曾华军等 讲者:陶晓鹏 归纳偏置(6) 候选消除算法的归纳偏置 {cH} 3个有偏程度不同的归纳学习算法 机械式 候选消除算法 Find-S 一种算法的有偏性越强,它的归纳能力越强,可以分类更多的未见实例。 某些归纳偏置隐含在学习器中,有些表示为断言集合,可由学习器操作。 2003.12.18 机器学习-概念学习 作者:Mitchell 译者:曾华军等 讲者:陶晓鹏

机器学习-概念学习 作者:Mitchell 译者:曾华军等 讲者:陶晓鹏 小结 主要内容 概念学习可看作搜索预定义潜在假设空间的过程 假设的一般到特殊偏序结构可以定义在任何概念学习问题中,这种结构便于假设空间的搜索 Find-S算法使用一般到特殊序,在偏序结构的一个分支上执行一般到特殊搜索,寻找一个与样例一致的最特殊假设 候选消除算法利用一般到特殊序,通过渐进地计算极大特殊假设集合和极大一般假设集合发现变型空间 候选消除算法缺少健壮性,第10章描述了几种基于一般到特殊序关系的概念学习算法,它们能够处理有噪声的数据和目标概念无法在假设空间中表示的情况 归纳学习算法隐含了归纳偏置,候选消除算法的偏置是:目标概念可以在假设空间中找到。输出的假设和对新实例的分类可由归纳偏置和训练样例演绎推出 2003.12.18 机器学习-概念学习 作者:Mitchell 译者:曾华军等 讲者:陶晓鹏

机器学习-概念学习 作者:Mitchell 译者:曾华军等 讲者:陶晓鹏 补充读物 Bruner et al.1957和Hunt & Hovland1963研究了概念学习以及一般到特殊的偏序 Winston1970的博士论文将概念学习看作是包含泛化和特殊化操作的搜索过程 Simon & Lea1973将学习的过程看作是在假设空间中搜索的过程 Mitchell1977, 1982提出变型空间和候选消除算法 Haussler1988证明,一般边界的大小随训练样例的数目成指数增长 Mitchell1979扩展了候选消除算法,以处理可预见的有限数量的误分类样例 Sebag1994, 1996展示了一种被称为析取变型空间的方法来从有噪声数据中学习析取概念 ... 2003.12.18 机器学习-概念学习 作者:Mitchell 译者:曾华军等 讲者:陶晓鹏