机器学习及其挑战 周志华 南京大学软件新技术国家重点实验室

Slides:



Advertisements
Similar presentations
簡介 …………………………p.1 健康新天地 ………………….p.2 小食餐單 …………………….p.3 士多啤梨 蘋果 之營養 p.4 蕃茄 葡萄之營養 p.5 鮮奶的益處 ………………….p.6 有關圖片...…………………..p.7 總結.
Advertisements

中医特色疗法及其在临床 中的应用 静乐县中医院 主治中医师 曹怀奎. 中药熏洗疗法是根据中医辨证论治的原则,依据疾 病治疗的需要,选配一定的中药组成熏蒸方剂,将中药 煎液趁热在皮肤或患处进行熏蒸、熏洗,而达到治疗效 果,是一种祖国医学最常用的传统外治方法。
毛周角化症的植物护理. 引 言 —— 本课题的必要性和可信度  目前 美容市场常用毛周角化症的护理方法:自行使 用去角质沐浴用品,像是磨砂膏、去角质刷、丝瓜 布等等。适度的去角质有一定的帮助,但过头就会 造成皮肤的伤害。过度的摩擦不只会使皮肤受伤, 还会使角质层变得更厚。  我们小组设计了一套天然植物的毛周角化症护理,
混合型多示例学习算法 张敏灵 周志华 南京大学计算机软件新技术国家重点实验室 2003 年 11 月.
鼻后孔阻塞综合征 程靖 1 、吴小海 2 1. 广东药学院附属第一医院(临床医学院) 耳鼻咽喉科学教研室 广州 广东药学院附属第二医院耳鼻咽喉科.
项目一:准备出库 出入库作业实务. 学习目标 1 .掌握出库的基本要求 2 .理解货物出库的依据和基本方法 3 .明确出库的作业流程 4 .能按要求完成货物出库前的准备工作 ,能计算出库货物的仓容,安排调配装 卸机具 5 .会填写各种出库单证 6 .掌握货物出库的各种方式.
张 猛,陕西安康人。 振东健康培训经理。 曾任教育培训师、保健品营销主管等职务。 从事中药保健养生护理用品研发工作 3 年,带领团 队完成 4 项课题 10 个产品的研发工作.
第三节 特殊饮食的护理 一、鼻饲法 目的 准备 操作步骤 注意事项 鼻饲法是将导管经鼻腔 插入胃内,从管内注入 流质食物、营养液、水 分和药物的方法。
小儿脑性瘫痪 广州中医药大学第二临床医学院 针灸教研室 樊莉. 概述 定义:指由于大脑在尚未成熟阶段受到损 伤所导致的运动障碍和姿势障碍,可伴有 智力低下、惊厥、听觉与视觉障碍、学习 困难等。是一种非进行性中枢性运动功能 障碍。 发病率为 1.3% ,男多于女。 属中医 “ 五软 ” 、 “ 五迟.
2013执业医师考试辅导 —卫生法规.
小荳荳-義大利麵 組員: 顏瑄誼.林欣嫻.李昱暄.黃珮瑜.潘錡..
(Pervasive Machine Learning)
第二节 散剂的特点及制备 散剂:系指药物或与适宜的辅料经粉碎、均 匀混合制成的干燥粉末状制剂,分为 口服散剂和局部用散剂。 特点 :①起效快 ②相对比较稳定 ③制法简 单 ④应用方式灵活 ⑤不宜制成散剂 的药物.
计算机网络教程 任课教师:孙颖楷.
成为顾客贴心、老板放心的金牌服务人员 ——顾客服务案例培训
——Windows98与Office2000(第二版) 林卓然编著 中山大学出版社
劳动关系法务-实操篇 规章制度修审与员工手册撰写.
关 爱 老 人 关 爱 健 康 第八章 老年人呼吸系统的变化及护理.
春季是细菌、病毒繁殖滋生的旺季,肝脏具有解毒、排 毒的功能,负担最重,而且由于人们肝气升发,也会引起旧 病复发,如春季肝火上升,会使虚弱的肺阴更虚,故肺结核 病会乘虚而入。中医认为,春在人体主肝,而肝气自然旺于 春季。如果春季养生不当,便易伤肝气。为适应季节气候的 变化,保持人体健康,在饮食调理上应当注意养肝为先。
吸烟有害健康 课题调查报告 无锡市新安中学初三(4)班.
健管之刊 ——处暑养生 健 康 管 理 部 第十四期.
第1章 电子商务案例分析概述.
7.5 乳化作用.
红花酒精湿敷 用于乳腺癌术后皮瓣坏死的新进展.
口服给药术 南通大学护理学院基础护理教研室.
网页设计师的职业成长规律 主讲:刘万辉 淮安信息职业技术学院.
实验四 果蝇培养、麻醉及雌雄鉴别 一 实验目的
关于在宝钢全体党员中开展“学党章党规、 学系列讲话,做合格党员”学习教育的 实施方案
教学成果 学生作品 2. 取得职业资格证书 3. 学生参赛成果.
五年规划 医路前行.
《人工智能》 机器学习 胡鹤.
克劳斯-雷克曼 教授 德国 凯勒数控教学仿真软件有限公司
人工智能技术导论 廉师友编著 西安电子科技大学出版社.
基于解释性语言的手机跨平台架构 Sloan Yi. Qt MTK.
高血脂症.
时代发展趋势: 科学人文交融 华中科技大学 杨叔子 2010年2月修改.
第五章 中耕机械 一、除草技术与中耕机械 ○ 化学除草剂:易于污染环境、有些草难以除尽 ○ 中耕机械:适于行间除草
数据仓库与数据挖掘实验.
                                                                                                                                                                
如何使用CiteSpace分析Derwent专利数据
嵌入式系统课程简介 宋健建 南京大学软件学院 2004/02/10.
中国科学技术大学 肖 明 军 《网络信息安全》 中国科学技术大学 肖 明 军
从现在做起 彻底改变你自己 Sanjay Mirchandani EMC公司高级副总裁、首席信息官.
存储系统.
大学计算机基础 典型案例之一 构建FPT服务器.
大数据管理技术 --NoSQL数据库 HBase 陈 辉 大数据分析技术.
Introduction to AI and ML
Online job scheduling in Distributed Machine Learning Clusters
数据挖掘工具性能比较.
WSDM见闻 程龚.
宁波市高校慕课联盟课程 与 进行交互 Linux 系统管理.
宁波市高校慕课联盟课程 与 进行交互 Linux 系统管理.
混合绘制 2019/4/5 Visual Analytics Group | CAD&CG国家重点实验室.
Three stability circuits analysis with TINA-TI
2019/4/16 关注NE官方微信,获取更多服务.
现代教育技术应用 第一章 现代教育技术基础 第6讲 何克抗教授关于多媒体课件的理论研究 单 位: 北京师范大学 作 者: 毛荷&王翠霞.
Cassandra应用及高性能客户端 董亚军 来自Newegg-NESC.
中文题名 介绍/亮点 研究方法 结果/讨论 结论 作者1 1*,作者2 1,2,作者3 2
AD相关LncRNA调控及分析方法研究 项目成员:魏晓冉 李铁志 指导教师:张莹 2018年理学院大学生创新创业训练计划项目作品成果展示
SIAM全文电子期刊数据库国际站使用指南
人工智能 制作人:蔡燊林 张恩玮.
基于最大margin的决策树归纳 李 宁.
SIAM全文电子期刊数据库国际站使用指南
北师大版五年级下册 购物策略.
基于列存储的RDF数据管理 朱敏
学习数据结构的意义 (C语言版) 《数据结构》在线开放课程 主讲人:李刚
入侵检测技术 大连理工大学软件学院 毕玲.
网页版报名流程 Step 4 点击“详情”查阅具体岗位信息,输入身份数据及申请序列码进行最终报名
高中物理“平抛运动的应用” 点评专家:谭一宁.
Presentation transcript:

机器学习及其挑战 周志华 南京大学软件新技术国家重点实验室 http://cs.nju.edu.cn/people/zhouzh/ 2003 年 12 月 27 日

汇报内容 机器学习及其重要性 机器学习角色的转变 五个挑战问题

机器学习 典型任务:预测 经典定义:利用经验改善系统自身的性能 随着该领域的发展,主要做智能数据分析 例如:天气预报 [T.Mitchell, Book 97] 随着该领域的发展,主要做智能数据分析 典型任务:预测 例如:天气预报

机器学习(续) 数据挖掘 数据分析技术 数据管理技术 机器学习 数据库

重要性 …… 工业过程控制 信息安全 遥感信 息处理 机器人 …… 生物 信息学 计算 金融学 分子 生物学 行星 地质学 机 器 学 习 美国航空航天局JPL实验室的科学家在《Science》(2001年9月)上撰文指出:机器学习对科学研究的整个过程正起到越来越大的支持作用,……,该领域在今后的若干年内将取得稳定而快速的发展

重要性:例子—网络安全 如何检测? 入侵检测: …… …… 历史数据:以往的正常访问模式及其表现、以往的入侵模式及其表现…… 对当前访问模式分类 入侵检测: 是否是入侵?是何种入侵? 这是一个典型的预测型机器学习问题 常用技术: 神经网络 决策树 支持向量机 k近邻 序列分析 聚类 …… ……

重要性:例子—生物信息学 常用技术: 神经网络 支持向量机 隐马尔可夫模型 k近邻 决策树 序列分析 聚类 …… ……

重要性(续) 计算机科学在过去十年中发展极为迅速,今后会快速稳定地发展、对科学做出更大贡献的领域 [E.Mjolsness & D. DesCoste, Science 01] 人工智能中最活跃、应用潜力最明显的领域(之一) [T.G. Dietterich, AIMag 97] 美国、欧洲各国都投入了大量人力物力 大型公司如波音、微软、通用电器等都有研究课题 已有一些研究成果进入产品

机器学习角色的转变 机器学习现在似乎已经发展到一个新阶段 如果我们想做出重要的贡献,首先需要把握住该领域发展的脉搏 机器学习现在似乎已经发展到一个新阶段 机器学习起源于人工智能对人类学习能力的追求,上一阶段的研究几乎完全局限在人工智能这一领域中(学习本身是目的) 而现在,机器学习已经开始进入了计算机科学的不同领域,甚至其他学科,成为一种支持技术、服务技术(学习本身是手段)

机器学习角色的转变(续) 现阶段对机器学习的研究可能不应再过多地强调模拟人的学习能力 可能应该把机器学习真正当成一种支持技术(手段而非目的),考虑不同领域甚至不同学科对机器学习的需求,找出其中具有共性的、必须解决的问题,并进而着手研究 我们暂且把这种视角下的机器学习称为: “普适机器学习”(Pervasive ML)

挑战问题(1):泛化能力 提高泛化能力是永远的追求 共性问题: 几乎所有的领域,都希望越准越好 目前泛化能力最强的技术: 支持向量机(SVM)产生途径:理论->实践 集成学习(ensemble learning) 产生途径:实践->理论

挑战问题(1):泛化能力(续) 第一个挑战问题: 今后10年 能否更“准”? 如果能,会从哪儿来?

挑战问题(2):速度 加快速度也是永远的追求 共性问题: 几乎所有的领域,都希望越快越好 “训练速度” vs. “测试速度 训练速度快的往往测试速度慢:k近邻 测试速度快的往往训练速度慢:神经网络

挑战问题(2):速度(续) 第二个挑战问题: 今后10年 能否更“快”? 能做到“训练快”、“测试也快”吗? 如果能,如何做?

挑战问题(3):可理解性 “黑盒子”能满足需要吗? 共性问题: 绝大多数领域都希望有“可理解性” 例子:医疗诊断 地震预测 目前强大的技术几乎都是(或基本上是) “黑盒子” 神经网络、支持向量机、集成学习 “黑盒子”能满足需要吗?

挑战问题(3):可理解性(续) 第三个挑战问题: 今后10年 能否产生“白盒子”? 是和“黑盒子”完全不同的东西, 还是从“黑盒子”变出来?

挑战问题(4):数据利用能力 没有标记的数据是没用的吗? 共性问题: 传统的机器学习技术 —> 对有标记数据进行学习 “标记” ——> 事件所对应的结果 共性问题: 随着数据收集能力飞速提高、Internet的出现,在大多数领域中都可以很容易地获得大量未标记数据 例子:医学图象分析 垃圾邮件过滤 没有标记的数据是没用的吗?

挑战问题(4):数据利用能力(续) “坏”数据一点用也没有吗? 共性问题: 传统的“坏”数据处理方式 —> “扔掉” 在绝大多数领域中都会遇到“坏”数据,有时甚至只有“坏”数据 例子:海军舰队 Web “坏”数据 ——> 大量噪音、属性缺失、不一致、…… 传统的“坏”数据处理方式 —> “扔掉” “坏”数据一点用也没有吗?

挑战问题(4):数据利用能力(续) 第四个挑战问题: 今后10年 能否“数据通吃”? 如何“吃”?

挑战问题(5):代价敏感 “错误”是没有区别的吗? 目前的机器学习技术 —> 降低错误率 共性问题: 大多数领域中的错误代价都不一样 把“好”当成“坏” 把“坏”当成“好” 共性问题: 大多数领域中的错误代价都不一样 例子:入侵检测 癌症诊断 一样吗?

挑战问题(5):代价敏感(续) 第五个挑战问题: 今后10年 能否“趋利避害”? 在达到较低的总错误率的基础上, 如何“趋”、如何“避”?

挑战问题:…… More …… 在任何一个挑战问题上取得突破性进展,都可能成为对机器学习的重要贡献

谢谢! 恭请各位专家 批评指正!