E-mail: dzd@keenage.com 意义的计算 -- 知网的进展与应用 董振东 董强 中科院计算机语言信息工程研究中心 语言知识研究室 e-mail: dzd@keenage.com http://www.keenage.com Tel: (8610)

Slides:



Advertisements
Similar presentations
讀經教育  第一組:吳碧霞、陳鍾仁  第二組:吳雪華、謝濰萁  第三組:邱國峰、林佳玫. 不論上智下愚 成功的教育 讓每個孩子 都能成為最優秀的人才.
Advertisements

护理部教学管理 南医大二附院 张淑芬. 护理部主要工作:  培训  质量  教学科研 临床教学的秘诀 What – 需要的、喜欢的 Who – 教师的角色 – 学生的程度、学习方式 How – 教学方法.
第二章 疾病概论 健康与疾病的概念 病因学 发病学 疾病的转归. 一、健康( health ) 健康至少应具备强健的体魄和健全的心理和精神状态。 二、疾病( disease ) 疾病是机体在一定条件下由病因与机体相互作用而产生的 一个损伤与抗损伤斗争的有规律过程,体内有一系列功能、 代谢和形态的改变,临床出现许多症状与体征,机体与外环.
北京联合智训企业管理咨询有限公司 2016年5月.第十四年开课 (本课程为北京联合智训2016年已经圆满开课的第18天自营公开课)
新闻写作基础知识 一. 新闻导语 二.新闻主体 三.新闻结构 四.角度选择.
企业培训师培训(上) 王 囤 副教授.
公文寫作 演講人 高 文 民.
應用寫作與口語表達之一 報 導 文 學.
第五章 中国的传统伦理道德 中国是一个重视伦理道德的国家,几千年来,伦理道德思想在中国文化中居于中心地位。伦理道德不仅体现于个人的思想品德、行为规范之中,而且和国家、社会的政治生活、经济生活等各方面都有联系。
使用說明 高年級 破解賽恩思 (Science)密碼 編輯群 明湖國小 吳立明 老師 李惠雯 老師 林宜璇 老師.
第六章 顾客购买行为分析 学习目标 了解顾客购买行为分析的模式 理解消费者购买行为的特征和类型 掌握影响消费者购买行为的因素
要SHOW才會贏 教你在生活中學企劃 救國團總團部活動處 文耀忠.
防災教育管理與資源整合 主講者:康麗娟.
【家庭生活記趣 】 ▲幫忙製作相關標題 有▲記號,請美編設計找圖案.
聰明小紅帽~ 自我身體保護 救國團新竹張老師 李 清 垣.
醫療產業發展的趨勢 自我健康管理.
社区营养管理与干预 第四军医大学唐都医院 叶琳 Tel: ,
大家好!.
性理釋疑(1—30題) 後學 阮章輝 學講.
死因診斷填寫的重要性 行政院衛生署統計室.
十二年國民基本教育 高雄區入學方式說明 報告人:中山工商 楊薇主任.
屏東區 十二年國民基本教育 「入學方式」宣導講綱
屏東區 十二年國民基本教育宣導 「入學方式」 屏東縣十二年國教宣導種子講師 飛夢林學園 黃豊欽.
數學解題王 ~從閱讀策略談起 分享者:吳祥銘老師.
案例研究报告撰写.
資2-6-3 能發現並討論問題 教育部增置國小圖書教師輔導與教育訓練計畫 圖書資訊利用教育教學綱要及教學設計小組
101學年度大學校院協助高中高職優質精進計畫/子計畫「產學創業企劃實務」
开放教育 入学指南.
1、什么是工具?你能给“工具”下个定义吗? 2、您在工作、学习中都使用哪些工具? 3、您知道(或使用)的第一本工具书是什么?
國語演說的指導訓練與實務分享 桃園縣中原國小 王宣驊.
讀 報 活 動 報紙版面知多少.
在职场 礼仪指导.
Web of Distributed Ontologies
唐琳 Tel: 财务会计学 唐琳 Tel:
第五章 医药营销团队建设 医药营销技术.
第三章 描述和分析问题.
“差异适应性”教学子模式之语文作文 改变一点点 吴家山第三中学 八年级语文组 张向华.
大鵬國小 符玉梅 Tel: #202 十分享唸 大鵬國小 符玉梅 Tel: #202.
新闻写作刍议.
湖南农业大学 通讯的采写.
Human Resource Management
离职流程精细化标准推进材料 人事行政处.
沿途风光讲解 全国职业教育数字化资源共建共享 旅游服务与管理 W-1.
政治生活:   积极参与 重在实践.
意义计算的实现 董强 董振东
4-1 電話禮儀的基本觀念 4-2 接聽電話的禮儀 4-3 打電話的禮儀 4-4 打國際電話的禮儀
新聞報導 一、什麼是新聞? 1、狗咬人不是新聞,人咬狗才是新聞 2、大眾關切的事 3、讀者有興趣知道的事 4、接近性.
教案名稱: 社群網站的益處 本教案製作者:毛俞婷
《知网2000座谈会》发言 董振东 董强 Tel: (8610) Tel: (8610)
工 作 分 析 Human resource management 东北林业大学经济管理学院 田昕加.
重估價模式 如果一項不動產丶廠房及設備的公允價值能可靠地衡量,則企業可以選用重估價模式作為後續衡量的會計政策。 採重估價模式其帳面金額為:
預備主的道路 (馬太福音3:1-12).
107學年度高雄區國中技藝技能 優良學生甄審入學說明會
107學年度高雄區 實用技能學程輔導分發 五福國中說明會
102-2金融法規(2~4) ~03..
意义的计算 -- 知网的进展与应用 董振东 董强 中科院计算机语言信息工程研究中心 语言知识研究室
南投縣106年度 結合家長會防制學生藥物濫用宣導
南投縣106年度 結合家長會防制學生藥物濫用宣導
Semantic Relations between Words
面試Cosplay 2015/03/31 by江宜倩.
108學年度高雄區國中技藝技能 優良學生甄審入學說明會
《知网》与意义的计算 董振东 董强 董振东 董强
地理试题名词动词初步统计 施林锋 王远.
构件图和部署图.
Adj + Noun映射到知识库中的classes
活動主題:能「合」才能「作」 指導教授:張景媛教授 設 計 者:協和國小團隊 李張鑫 × 陳志豪.
第一节 计划的概念及其性质 第二节 计划的类型 第三节 计划编制过程
耶稣在伯大尼长大痲疯的西门家里坐席的时候, 有一个女人拿着一玉瓶至贵的真哪哒香膏来,打 破玉瓶,把膏浇在耶稣的头上。有几个人心中很 不喜悦,说:何用这样枉费香膏呢﹖这香膏可以 卖三十多两银子赒济穷人。他们就向那女人生气。 耶稣说:由她吧!为什么难为她呢﹖她在我身上 做的是一件美事。因为常有穷人和你们同在,要.
校园新闻写作实务 Reporter : 王琳 01 Designed By JUSTxcb.
Presentation transcript:

e-mail: dzd@keenage.com 意义的计算 -- 知网的进展与应用 董振东 董强 中科院计算机语言信息工程研究中心 语言知识研究室 e-mail: dzd@keenage.com http://www.keenage.com Tel: (8610) 6287-5641 Tel: (8610) 6676-8816

讨论题目 不变的是什么? 变了什么? 变成什么样了?

不变的是什么(1) 《知网》的性质 -- 描述概念与概念之间的关系,以及概念的属性与属性之间的关系的知识库 Dong Zhendong, "Knowledge Description: What, How and who?", Proceedings of International Symposium on Electronic Dictionary, Tokyo, 1988, p.18

不变的是什么(2) 《知网》的哲学 -- 本质属性或非本质属性的差别决定概念之间的差别 --知识是关系的系统,是概念与概念之间的关系,概念的属性与属性之间的关系的系统 -- 万物都在特定的时空中变化,从一种状态转变为另一种状态,这样的转变体现于它的属性的变化 -- 本质属性或非本质属性的差别决定概念之间的差别

不变的是什么(3) 《知网》的建构理念和设计 -- 关系是灵魂,揭示关系是《知网》的中心 -- 基于义原(sememe),特征的静态描述为主 -- 采用动态角色激活静态特征 -- 面向计算机

多层语义关系网络(MLRN)

《知网》的知识获取与表达 -- 义原(sememe) 义原的认定 义原的提取 中文字义为基础 4,000汉字  2,200义原 英文词义为对照 义原的范畴

义原的范畴 实体 万物 (物质、精神、事情) 部分 (部件、配件) 时间 空间 (方向、位置) 事件 (关系/状态、动作) 属性 属性值 (外观、量度、特性、关系、状况) 数量 数量值

变了什么? 《知网》的知识词典描述语言(KDML),从原来的线性的描述方式改进为树型的、可嵌套的描述方式;原来的各种关系的表示从隐性、有的含混的变为显性的、无含混的。 对属性和属性值义原做了重大的调整和补充。同时对其他义元表也做了相应的调整。 增加了一些各种关系的检索模式。 增加了事件关系与动态角色转换模块。 将《中文信息结构库》进行了规则化处理,并针对这些规则编写了相应的解释器。

《知网》采用的义原 1503 => 2199 实体 141 => 153 《知网》采用的义原 1503 => 2199 实体 141 => 153 万物(物质、精神、事情、组织) 134 => 146 部分(部件、配件) 3 时间 1 空间(方向、位置) 3 事件(关系/状态、动作) 813 => 817 属性值(外观、量度、特性、关系、状况) 316 => 859 数量值 13 => 18 属性 117 => 236 数量 6 次要特征 99 => 110

HowNet 释义一例 W_C=店 G_C=N E_C=旅~,星级饭~,黑~,住~,~里没空房,住酒~,星级酒~ W_E=inn G_E=N E_E= DEF={InstitutePlace|场所:{eat|吃:location={~}},{reside|住下:location={~}},{recreation|娱乐:location={~}},RelateTo={tour|旅游},domain={economy|经济}} E_C=~铺,商~,夫妻~,夫妻老婆~,便民~,小卖~,专卖~,书~,布~,药~,花~,小吃~,精品~,礼品~,玩具~,服装~,烟纸~,南货~,食杂~,宠物~ W_E=shop DEF={InstitutePlace|场所:{sell|卖:agent={~}},{buy|买:location={~}},domain={economy|经济}}

KDML改进 W_C=北麓 G_C=N E_C= W_E=northern foot of a mountain G_E=N E_E= (原)DEF=part|部件,%land|陆地,base|根 (新)DEF={part|部件:whole={land|陆 地:PartPosition={base|根}},modifier={north|北}}

KDML改进 W_C=被告人 G_C=N W_E=accused G_E=N DEF=human|人,$accuse|控告,police|警 DEF={human|人:{accuse|控 告:patient={~}},domain={police|警}} W_C=被告席 W_E=dock DEF=location|位置,@sit|坐蹲,#accuse|控告,police|警 DEF={location|位置:{sit|坐蹲:location={~},agent={human|人:{accuse|控告:patient={~}},domain={police|警}}}}

WordNet 释义一例 The noun shop has 2 senses (first 2 from tagged texts) 1. shop, store -- (a mercantile establishment for the retail sale of goods or services; "he bought it at a shop on Cape Cod") 2. workshop, shop -- (small establishment where handcrafts or manufacturing are done)

概念描述的举例 (1) 医生:DEF={human|人:domain={medical|医}, HostOf={Occupation|职位},{doctor| 医治: agent={~}}} 患者:DEF={human|人:domain={medical|医}, {SufferFrom|罹患:experiencer={~}}, {doctor|医治:patient={~}}} 医院: DEF={InstitutePlace|场所:{doctor|医治: location={~},content={disease|疾病}}, domain={medical|医}}

概念描述的举例 (2) 病历:DEF={document|文书:{record|记录: content={disease|疾病},LocationFin={~}}, domain={medical|医}} 健康:DEF={Health|健康: host={AnimalHuman|动物}} 多病:DEF={unhealthy|不健} │ │ ├ {HealthValue|健康值} │ │ │ ├ {healthy|康健} │ │ │ └ {unhealthy|不健}

概念描述的举例 (3) 病:{disease|疾病} {phenomena|现象: {doctor|医治:content={~}},{SufferFrom|罹患 :content={~}},RelateTo={medicine|药物} {Health|健康}{HealthValue|健康值}, domain={medical|医}} 药: {medicine|药物} {artifact|人工物:{doctor|医治 :instrument={~}},RelateTo={disease|疾病}, domain={medical|医}{chemistry|化学}}

《知网》的灵魂 – 关系 1. 上下位 2. 事件必要角色框架 3. 事件关系与角色转换 4. 同义 5. 反义 6. 对义 7. 整体-部件 8. 宿主-属性 9. 属性-属性值 10. 实体-相应事件 11. 制成品-材料 12. 各种动态角色关系

上下位关系 (1) - {entity|实体} ├ {thing|万物} {entity|实体:{ExistAppear|存现:existent={~}}} │ ├ {physical|物质} {thing|万物:{HostOf={Appearance|外观}},{perception|感知:content={~}}} │ │ ├ {animate|生物} {physical|物质:{HostOf={Age|年龄}},{alive|活着:experiencer={~}},{die|死:experiencer={~}},{metabolize|代谢:experiencer={~}},{reproduce|生殖:agent={~}},{reproduce|生殖:PatientProduct={~}}} │ │ │ ├ {AnimalHuman|动物} {animate|生物:{HostOf={Sex|性别}},{AlterLocation|变空间位置:agent={~}},{StateMental|精神状态:experiencer={~}}} │ │ │ │ ├ {human|人} {AnimalHuman|动物:{HostOf={Name|姓名}{Wisdom|智慧}{Ability|能力}},{think|思考:agent={~}},{speak|说:agent={~}}}

上下位关系 (2) - {event|事件} ├ {static|静态} │ ├ {relation|关系} │ │ ├ {isa|是非关系} │ │ │ ├ {be|是} {relevant,isa}/{relevant,descriptive} │ │ │ │ ├ {become|成为} {relevant,isa}/{relevant,descriptive} │ │ │ │ └ {mean|指代} {relevant,isa}/{relevant,descriptive} │ │ │ └ {BeNot|非} {relevant,isa}/{relevant,descriptive} │ │ ├ {possession|领属关系} │ │ │ ├ {own|有} {possessor,possession} │ │ │ │ ├ {obtain|得到} {possessor,possession,source} │ │ │ │ └ {receive|收受} {possessor,possession,source} │ │ │ ├ {BelongTo|属于} {possessor,possession} │ │ │ ├ {OwnNot|无} {possessor,possession} │ │ │ │ └ {lose|失去} {possessor,possession} │ │ │ │ └ {InDebt|亏损} {possessor,possession} │ │ │ └ {owe|欠} {possessor,possession,target}

事件动态角色 (1) {Event Role and Features} ├ {EventRole} 动态角色 │ ├ {relevant} 关系主体 │ ├ {existent} 存现体 │ ├ {experiencer} 经验者 │ ├ {agent} 施事 │ ├ {coagent} 合作施事 │ ├ {possession} 占有物 │ ├ {patient} 受事 │ ├ {PatientPartPosition} 部件部位受事 │ ├ {PatientProduct} 成品受事 │ ├ {PatientAttribute} 受事属性 │ ├ {PatientaValue} 受事属性值

事件动态角色 (2) │ ├ {content} 内容 │ ├ {ContentProduct} 内容成品 │ ├ {PartOfTouch} 触及部件 │ ├ {content} 内容 │ ├ {ContentProduct} 内容成品 │ ├ {ResultContent} 结果内容 │ ├ {isa} 类指 │ ├ {PartOf} 部分 │ ├ {whole} 整体 │ ├ {host} 宿主 │ ├ {HostOf} 之宿主 │ ├ {descriptive} 描写体 │ ├ {result} 结果

事件关系和角色转换 sorrowful|悲哀 weep|哭泣 [consequence]; experiencer OF sorrowful|悲哀=agent OF weep|哭泣; cause OF sorrowful|悲哀= cause OF weep|哭泣; BeBad|衰变 [cause]sorrowful|悲哀; experiencer OF BeBad|衰变=experiencer OF sorrowful|悲哀; BeBad|衰变 ITSELF=cause OF sorrowful|悲哀. unfortunate|不幸BeBad|衰变 [hypernym]; experiencer OF unfortunate|不幸=experiencer OF BeBad|衰变. defeated|输掉BeBad|衰变 [hypernym]; experiencer OF defeated|输掉=experiencer OF BeBad|衰变.

实体-属性-属性值的关系 头/发型:{Pattern|样式:host={part|部件:whole={human|人},PartPosition={hair|毛}}} PatternValue|样式值 = Value of Pattern|样式 ├ {fashionable|时髦} └ {unfashionable|背令}

《知网》的应用 1. 语料库语义标注:香港科技大、清华 2. WSD,Sense Pruning:山大、台湾中研院、 厦大、香港科技大 3. 敏感信息发现:解放军某部 4. 信息过滤:厦大 5. Personalized IR:计算所 6. Semantic Web:台湾工研院 7. 与WordNet比较研究:马里兰大学、香港科技大

欢迎提问和批评