从人工智能看自然语言处理 张 钹 清华大学计算机系.

Slides:



Advertisements
Similar presentations
Date: File:SSP2_07C.1 SIMATIC S7 Siemens AG All rights reserved. Information and Training Center Knowledge for Automation 检测逻辑错误 ??
Advertisements

一、老师申请题目,以下指导老 师操作。 1. 登录教务系统 web 端. 2. 点击 “ 毕业设计 ” 工具栏下拉菜单中的 “ 论文 _ 教师申请题目 ”
白先勇 教授陳韻如 學號U 學生錢冠華.
考点作文十大夺魁技法 第28课时 写作(二) 考点作文十大夺魁技法 6-10 ·新课标.
叙事学导引 ——以《桥边的老人》为例.
舊石器時代 位置: 亞洲大陸東緣,西太平洋弧狀列島一部份 背景 形成: 兩千多萬年前逐漸隆起,形成島嶼 生物: 大角鹿、猛瑪象、亞洲大陸原始人 臺東 長濱文化 苗栗 網形文化 臺南 左鎮人目前臺灣發現最早人類化石 代表 文化 1.住在海邊洞穴-短期定居小型隊群 2.以採集、狩獵為生 3.使用礫石砍伐器、片器、尖器.
學 習 輔 導 的 實 施 組長: 李貞儀 組員: 吳巧玲 李佳蔚
學校護理專業發展數據說~ 學校護理的數據迷雲
台電經營績效,夠國際水準嗎? 核四封存後的能源選擇問題 ★台電經營有績效  不遜於先進國家 ★火力機組效率優良、核電廠績效國際評比優異
(Problem-Based learning 教学法)
Classification of Web Query Intent Using Encyclopedia 基于百科知识的查询意图获取
第八章 作业成本法 对现代企业而言,生产过程复杂、制造费用在产品成本中所占比重极大,且与人工费用并无直接关系,仍然采用制造费用分配方法,就会导致成本信息扭曲、误导管理措施、致使决策失误的严重后果。 本章主要阐述作业成本法的基本理论及其应用。
天文学信息化建设初步设想 赵永恒 国家天文台 2006年11月.
关于在宝钢全体党员中开展“学党章党规、 学系列讲话,做合格党员”学习教育的 实施方案
教師晨會經驗分享 小學雙語實驗教育實施現況之研究 計畫主持人:陳金粧校長、馮思義副校長 指導顧問:陳惠邦教授、鄧奮忠主任、呂慧芬組長
第八章 网络课程的设计与开发.
第 一 章 數位學習概論 課程名稱:數位學習 授課老師:李春雄 博士 2017/3/17.
感知学习 ——可视化学习平台.
記 敘 中文創意寫作 講 師:楊宏通.
人工智能技术导论 廉师友编著 西安电子科技大学出版社.
院長:鄭錦聰 教授 各系負責老師 光電系:姬梁文老師 電機系:張凱雄老師 資工系:謝仕杰老師 電子系:陳柏宏 老師
組長:黃淑雅 組員:葉建佑 許家瑜 詹文榮 林莉雯 吳姿嫻 吳培雯 蔡承澍 黃寓筠 陳敬淳
统计学Statistics 主讲人:商学院 刘后平 教授
互联网时代班主任的挑战 万玮 2014年9月20日.
综合教程 2 Unit 1 Lifelong Learning
计算机基础知识 丁家营镇九年制学校 徐中先.
统计学习基础 卿来云 中国科学院研究生院信息学院 / 统计对研究的意义:
騎乘單車如何配速 桃園縣攝影藝術協會 鐵馬車隊 鄭育宏 製作 1/12.
Adversarial Multi-Criteria Learning for Chinese Word Segmentation
Semantic-Synaptic Web Mining: A Novel Model for Improving the Web Mining 報告者:陳宜樺 報告日期:2015/9/25.
A Question Answering Approach to Emotion Cause Extraction
文化與觀點意識 臺北市立教育大學陳麗華教授.
课程与编码:语言学与应用语言学 张露茜(博士) 浙江工商大学 外国语学院
臺中市外埔國民小學 102學年度上學期期初校務會議 簡報者—校長 吳文芳.
Ancient Chinese 陕西师大古代汉语教研室.
社福場所的實地學習體驗 (與傷殘人士共融)
鄉村尋根-農具篇.
第 9 章 基本的資料探勘、線上分析處理、資訊呈現.
善用教學評量 激勵學生學習動機 李坤崇教授 南台科技大學教育領導與評鑑所 經歷: 國立成功大學教育所教授兼所長
1 Introduction Prof. Lin-Shan Lee.
Data Mining 第八組 B 萬佳育 B 葉書蘋.
行走在“微课”的路上 陈芝飞.
陳明璋 一個引導注意力為導向的數位內容設計及展演環境 Activate Mind Attention AMA
金融行銷溝通技巧- 溝通的藝術 南山人壽洪全銘經理
基于规则抽取的 时间表达式识别.
湖南大学-信息科学与工程学院-计算机与科学系
第9章 图形输出 在AutoCAD中,系统提供了图形输入、输出接口。用户不仅可以将其它应用程序中处理好的数据传送给绘图AutoCAD,还可以将在AutoCAD中绘制好的图形打印出来,或者把他们的信息传送给其他应用程序。
1 Introduction Prof. Lin-Shan Lee.
Answering aggregation question over knowledge base
模式识别与智能系统研究中心介绍 2017年8月.
蔡惠玲 (Daphne Tsai) Sept. 26th, 2010
暑期活动见闻 程龚.
資料銷售方式對圖書館聯盟的衝擊 黃鴻珠 淡江大學圖書館
資訊概論 授課教師 : 吳寂絹
Doing Business In Japan
決策支援系統導論 資訊管理系 王淑卿.
现代教育技术应用 第一章 现代教育技术基础 第6讲 何克抗教授关于多媒体课件的理论研究 单 位: 北京师范大学 作 者: 毛荷&王翠霞.
Learn Question Focus and Dependency Relations from Web Search Results for Question Classification 各位老師大家好,這是我今天要報告的論文題目,…… 那在題目上的括號是因為,前陣子我們有投airs的paper,那有reviewer對model的名稱產生意見.
Representation Learning of Knowledge Graphs with Hierarchical Types
2011年教學觀摩會 教學心得報告 共同學科軍訓室馬毓君 2011年4月28日.
主講人:陳鴻文 副教授 銘傳大學資訊傳播工程系所 日期:3/13/2010
李允中教授-軟體工程實驗室研究方向 觀點導向之軟體發展(Aspect-Oriented Software Development): 觀點導向軟體開發方法主要源自於重新思考軟體系統的模組化(Modularization)以及關注點分離的概念(Separation of Concerns)。當建構軟體系統功能時,往往會發現到除該功能本身之外,必須還要在這些功能上特別關注其他面向的考量,例如執行效能的面向、元件或模組的再利用性、系統的可靠程度等等。因此,一個軟體系統內,往往存在著這些錯綜交織的面向於軟體開發的
中国农业科学院博士后学术论坛 博士后基金申请的经验及体会 中国农业科学院生物技术研究所 秦 华 博士
Introduction of this course
“修身成材” 班级干部培训班 黑龙江大学党委学工部.
電子商務 第10章 知識管理.
Seminar 【Speaker】 Feng Shuaizhang, assistant professor of the
Non-Projective Parsing for Statistical Machine Translation
電子表單 簡介 高雄市鳳山區新甲國小 陳信宏.
教師檔案系統資料如何填寫? 如何對應教師評鑑共同基準?.
Presentation transcript:

从人工智能看自然语言处理 张 钹 清华大学计算机系

1、自然语言处理是何问题 ? 南京市长江大桥 一个普适问题:数据空间到语义空间的映射(mapping) Data Semantics 分词 (机器) Semantics (用户) 分词 南京市长江大桥

2、不适定问题 数据到语义空间的映射 数据依语义空间的分类(classification) 这是一个“不适定”(ill-posted) 问题 解的存在性 解的唯一性 解的稳定性 比如“分词”

3、如何解决这个难题? 解决病态问题的途径-“约束” 知识密集问题( knowledge Intensive) 语言知识(语法,语义等) 领域知识 常识 南京市长江大桥

3、结构分析法的局限性 自然语言的结构 层次性(hierarchy) 不确定性(uncertainty) Long distance dependency Multi-scale information fusion       

3、结构方法的局限性(2) Parsing, Rule-based等遇到的困境 “他由于对南京市一无所知,连市长 是谁都不清楚,因此把南京市长江大 桥,误认为南京市长江大桥了。” Long distance dependency contextual dependency

3、结构方法的局限性(3) 结构分析 语义 解决方案: 语义知识 概率统计 Probability

4、数据-天赐良机 网络时代的财富 数据(Data) Data Driven Learning from data 概率统计的时代

5、计算机对联 ---摘自微软亚洲研究院(周明) 5、计算机对联 ---摘自微软亚洲研究院(周明) 江枫渔火对愁眠 质量第一 风吹雁过雨连宵 月落乌啼霜满天 平湖秋月明 苏堤春晓秀 电子商务热热闹闹 网上购物红红火火 唐 张继 枫桥夜泊

Log Statistics

Training data Manual collection Couplets Language model Trigram model 2,149,882 sentence pairs Translation model 342,255 couplets 115,290 pairs of sentences 46,280 manually Couplets: books, web, novel titles, ancient poetry

计算机诗歌 茫茫春光催碧草,晓露琼楼阑珊色。 浔阳江头夜送客,枫叶荻花秋瑟瑟。 主人下马客在船,举酒欲饮无管弦。 清明传语愁送客,两岸千里欲渡河。 茫茫春光催碧草,晓露琼楼阑珊色。 —— 计算机(摘自厦门大学周昌乐书) 浔阳江头夜送客,枫叶荻花秋瑟瑟。 主人下马客在船,举酒欲饮无管弦。 …. —— 白居易 “琵琶行”

7、今后的道路? Cognitive power + Computational power 知识、数据、结构 搜索、计算能力 +

前途? Oliver Sacks,New York Review, 2004 “A movie, with its taut stream of thematically connected images, its visual narrative integrated by the viewpoint and values of its director, is not at all a bad metaphor for the stream of consciousness itself. .... The mechanism of our ordinary knowledge is of a cinematographical kind.” Oliver Sacks,New York Review, 2004

谢谢 !