Presentation is loading. Please wait.

Presentation is loading. Please wait.

从人工智能看自然语言处理 张 钹 清华大学计算机系.

Similar presentations


Presentation on theme: "从人工智能看自然语言处理 张 钹 清华大学计算机系."— Presentation transcript:

1 从人工智能看自然语言处理 张 钹 清华大学计算机系

2 1、自然语言处理是何问题 ? 南京市长江大桥 一个普适问题:数据空间到语义空间的映射(mapping) Data Semantics 分词
(机器) Semantics (用户) 分词 南京市长江大桥

3 2、不适定问题 数据到语义空间的映射 数据依语义空间的分类(classification) 这是一个“不适定”(ill-posted) 问题
解的存在性 解的唯一性 解的稳定性 比如“分词”

4 3、如何解决这个难题? 解决病态问题的途径-“约束” 知识密集问题( knowledge Intensive) 语言知识(语法,语义等)
领域知识 常识 南京市长江大桥

5 3、结构分析法的局限性 自然语言的结构 层次性(hierarchy) 不确定性(uncertainty)
Long distance dependency Multi-scale information fusion

6 3、结构方法的局限性(2) Parsing, Rule-based等遇到的困境 “他由于对南京市一无所知,连市长
是谁都不清楚,因此把南京市长江大 桥,误认为南京市长江大桥了。” Long distance dependency contextual dependency

7 3、结构方法的局限性(3) 结构分析 语义 解决方案: 语义知识 概率统计 Probability

8 4、数据-天赐良机 网络时代的财富 数据(Data) Data Driven Learning from data 概率统计的时代

9 5、计算机对联 ---摘自微软亚洲研究院(周明)
5、计算机对联 摘自微软亚洲研究院(周明) 江枫渔火对愁眠 质量第一 风吹雁过雨连宵 月落乌啼霜满天 平湖秋月明 苏堤春晓秀 电子商务热热闹闹 网上购物红红火火 张继 枫桥夜泊

10 Log Statistics

11 Training data Manual collection Couplets Language model Trigram model 2,149,882 sentence pairs Translation model 342,255 couplets 115,290 pairs of sentences 46,280 manually Couplets: books, web, novel titles, ancient poetry

12 计算机诗歌 茫茫春光催碧草,晓露琼楼阑珊色。 浔阳江头夜送客,枫叶荻花秋瑟瑟。 主人下马客在船,举酒欲饮无管弦。
清明传语愁送客,两岸千里欲渡河。 茫茫春光催碧草,晓露琼楼阑珊色。 —— 计算机(摘自厦门大学周昌乐书) 浔阳江头夜送客,枫叶荻花秋瑟瑟。 主人下马客在船,举酒欲饮无管弦。 …. —— 白居易 “琵琶行”

13 7、今后的道路? Cognitive power + Computational power 知识、数据、结构 搜索、计算能力

14 前途? Oliver Sacks,New York Review, 2004
“A movie, with its taut stream of thematically connected images, its visual narrative integrated by the viewpoint and values of its director, is not at all a bad metaphor for the stream of consciousness itself The mechanism of our ordinary knowledge is of a cinematographical kind.” Oliver Sacks,New York Review, 2004

15 谢谢 !


Download ppt "从人工智能看自然语言处理 张 钹 清华大学计算机系."

Similar presentations


Ads by Google