Presentation is loading. Please wait.

Presentation is loading. Please wait.

Web of Distributed Ontologies

Similar presentations


Presentation on theme: "Web of Distributed Ontologies"— Presentation transcript:

1 Web of Distributed Ontologies
www 和 ontology ontology 和 哲学 onto面对web新情景 构建onto(特别是领域性的onto)究竟是 着重于反映现实, 还是着重于制定规范? 逻辑及 DL描述逻辑在onto搭建中的作用 Web of Distributed Ontologies 半自动构建onto 许卓群 北京大学 信息科学技术学院 网络与信息系统研究所 references

2 飞禽、养育、宠物 Dangdang google back

3 概念(CONCEPT) 、词语(WORD) 、 和含义(sense,剧情与情景)
每个词语一般有多个语义的解释,一个词对应多个情景中的概念,例如The noun “pet” has 4 senses in WordNet. 1. pet -- (a domesticated animal kept for companionship or amusement) 2. darling, favorite, favourite, pet, dearie, deary, ducky -- (a special loved one) 3. pet -- (a fit of petulance or sulkiness 吵闹(especially at what is felt to be a slight)) 4. positron emission tomography, PET -- (using a computerized radiographic technique to examine the metabolic activity in various tissues (especially in the brain))

4 知网--- 其他onto可以利用它 NO.=000001 W_C=打 G_C=V E_C=~酱油,~张票,~饭,去~瓶酒,醋~来了
W_E=buy G_E=V E_E= DEF=buy|买 NO.=015492 W_C=打 G_C=V E_C=~毛衣,~毛裤,~双毛袜子,~草鞋,~一条围巾,~麻绳,~条辫子 W_E=knit G_E=V E_E= DEF=weave|辫编

5 www 和onto,WWW需要 Ontology吗?
WWW的复用困难,表现在语义层的理解困难,tag的含义 什么是www的 onto? 数据和元数据,词、概念、概念的内涵与外延 用DL逻辑描述Onto,语义三元组 建设web的人愿意在建设web page 的同时描述onto? 分布式Onto,onto之间的merging

6 Onto、 哲学、和WWW onto 和 哲学 , onto 是知识 onto 面对 WWW 新情景
① Aristotle 亚里士多德的‘元物理’ metaphysics和ontology; ② Descartes笛卡尔(怎样反映现实 how)的epistemology; ③ Russell罗素logic,the study of valid reasoning,研究 logical theory of meaning,公理系统内的外延与内涵 onto 面对 WWW 新情景 ④现实世界与万物之灵:人与自我; 人与自然; 人与社会; ⑤人与WWW虚拟社会; 需要认识这个虚拟社会

7 onto 和 哲学 Aristotle 亚里士多德
把metaphysics和ontology一起研究。What is the basis of physics? 元物理学,物理学所基于的自然哲学基础, 是元理论,描述客观世界、描述物理知识的描述理论 Descartes笛卡尔是唯物论者,研究epistemology,研究how? 头脑如何从彼岸获得反映客观世界的第一手知识? 思想意识与彼岸自在之物的实践互动,怎样产生出知识?

8 Russell罗素,强调logic 逻辑 是 the study of valid reasoning — how to reason。
ontology 和 哲学 --逻辑 Russell罗素,强调logic 逻辑 是 the study of valid reasoning — how to reason。 研究 logical theory of meaning,语义局限于 外延与内涵,可满足性(无矛盾) 一阶谓词逻辑的框框让思想thought、 感知perception、语言language、情感emotion等,一旦进入逻辑公理系统,概念的含义就被圈死了,变成 内涵外延的解释问题,成为公理系统的可满足性

9 WWW 新情景 和不认识的‘人’交往需要‘语义’
人与自我 大脑的反思:人的大脑、意识与人自己的身体、感知、… 人与自然,物理学和派生出的各类自然科学,所提出的概念和描述语言,… 人与人,语言和交往,和不认识的‘人’交往需要‘语义’ 人 与 WWW的web,人要间接地通过这个web和大量不认识的人交往,通过其代理agent交往

10 WWW新情景,--概念的开放语义 概念的含义理解强调 context,概念所涉及的事件,事件所发生的情景,因此
理解概念(例如养育)的语义,就要理解概念所关联的‘事件流’(张女士幼年被她的双亲抛弃,由她的婶子带大养育成人),一个概念所关联着的一组事件(流);而每一事件(事件流)关联着情景,一组情景,情景集合。

11 概念的开放语义 ,一阶逻辑不能适应 概念的语义不能限制于系统内的外延和内涵。 Agent 与自我, Agent 的自我意识与agent理解其感知 Agent 与世界,在交往中,在实践中感知 时间空间等语义关系 含义的解释要强调 context,概念的开放语义不能限制于个别系统内相对封闭的外延和内涵。概念涉及事件,事件涉及所发生的情景

12 语义的基本单位—概念、词语和情景(剧情)
对词语的理解方式,不同的人对同一个词语有不同的理解,广度、深度都不同。 反映其词语和自己的情景记忆集合,在深度和广度上的不同,关联抽象能力的不同。受教育程度不同、和实践的广度和深度不同,意味着情景记忆集合不同 字典,解释词语的含义的方式假设了人脑的这一情景联想能力,和概念抽象能力 学英语,词语和 情景, 粗懂:熟练:本土化:语言大家 0.5万:2万:10万:200万 Knowledge Chunks 大脑的瞬时记忆,工作记忆,和长期记忆 知识单位Chunk,和概念、剧情、情景有密切关系

13 一个Ontology 规定了一种论域context
三类交互讨论方式(交叉领域) 人与人在这一论域中的交互讨论, 这时,要求用词范围广,用词定义有深度,但不必那么确切,可以模糊,必要时可以循环定义, 人和机器的交互讨论, 语义的表达,不一定全部使用文字,可以用多媒体图示语义 计算系统之间的交互讨论 语义的表达必须确切,不容许语义冲突,不可循环定义

14 WWW的基本困难 --计算机难于直接理解网页内容
keywords往往弄偏从web上寻找想要的信息的方向 抽取信息。建立门户网站为某些特定需要的用户群服务(这是永恒主题之一),这个门户网站要从很多有用网站较完整地提取反映该用户群的‘有用’ 的信息(并能及时地更新) 预案绑定。web办公环境下,web上的工作流要和办公人员交互,服务之间的交互。如果在工作流制定前已经确定协议,那么信息交换就是收发消息。但是对于例外情况,预案处理需要ontology 来解释处理方案。 原来不熟悉的agent交换信息,需要ontology。

15 Web of Distributed Ontology
目录 web 为什么需要 ontology ? ontology 和 哲学 onto面对web新情景 构建onto(特别是领域性的onto)究竟是着重于反映现实,还是着重于制定规范? 逻辑及 DL描述逻辑在onto搭建中的作用? 和AI研究其它方向的关系? 半自动的构建onto?

16 构建Ontology 圈定一个知识范围 圈定知识的应用范围 圈出抽象的知识层次 从应用领域的知识范围来圈定,如 微电子业、或者 汽车业;
从应用领域的知识范围来圈定,如 微电子业、或者 汽车业; 或者从抽象级别上来圈定:涉及的常用词语,如 尺寸、热耗、速度等属性词语,从语义上深一步探讨,则需要在更基本的、抽象级别上定义,为此,需要在抽象一级圈出知识范围 圈出抽象的知识层次 Metadata级,在工程、物理的公用知识级别上,运用尺寸、热耗、速度等术语的ontology 元级别又基于更为基本的元级别,如探讨最基本的时间、空间、物质等概念的语义内涵。元物理学

17 构建onto的深度 对世界的认识是无限的 这里无法涉及构建onto方法论的细节 一个Ontology所涉及的概念词语集合,
收集概念词语,相对不困难 引用其他已经建立的onto, 对于加强互操作性非常重要 属性和关系,它是理解含义的关键 种属关系,部分和整体关系,好办 其他关系? 无限多?囊括哪一些关系、属性?

18 着重于反映现实,还是着重于制定规范? Web Ontology: Spec?
语义描述主要是为计算机容易利用。不求语义的完整和深入,只求语义表达的可共享性和可扩展性。 把共同约定、共同享用的知识(词语的语义规范),用计算机容易处理的形式表达出来。网页中所含的宝贵信息,通过tag(tag本身是词语)标识,而词语的语义则用ontology来理解是否真的合用, 如‘养育’一词在该网站范围是否意味着:从幼小 开始 培养。

19 逻辑及 DL描述逻辑在onto搭建中的作用?
目录 web 为什么需要 ontology ? ontology 和 哲学 onto面对web新情景 构建onto(特别是领域性的onto)究竟是 着重于反映现实, 还是着重于制定规范? 逻辑及 DL描述逻辑在onto搭建中的作用? 半自动的构建onto?

20 Ontology 和逻辑 准确性、严密性:只要是比较有严格基础的本体表示必须是基于逻辑的,因为本体需要‘逻辑’推理来检验某个onto是否‘无矛盾’,利用逻辑理论来分析推理,用另一些更基础的推理来实现更为复杂推理 缺陷:目前的逻辑理论,是基于一阶谓词逻辑FOL的,因此FOL的表示知识的缺陷多数也是onto描述语言的缺陷,例如,涉及时空关系的连续变化的事件流,基于统计数据的不确定知识(容许矛盾冲突),多个agent之间互相不了解、有冲突认识和偏见,但要协调一起工作。

21 靠人工编写onto, 机器辅助? 例如 Yahoo 信息提供商收集了广泛的‘页面词语’按照语义分类层次,形成Yahoo hierarchy
又,Dublin Core描述网页发布涉及的信息资源(Content ,Intellectual Property ,Instantiation) 又,Ontologies for the Semantic Web:Time and Space,Jerry R. Hobbs, USC/ISI

22 Ontology描述基本概念:时间和空间
Allen Interval Algebra,Topological relations, 时间点和区间 Begin(t,T), Ends(t,T),时间区间之间的关系Interval-Starts,Interval-equals,Interval-Before, Interval-meets,Interval-overlaps, Interval-during, Interval-finishes 时间大小尺度Seconds,Minutes,Hours,Days,Weeks,months,Years 历史 阳历和阴历 Calendar 集聚词, four consecutive Sundays 过去现在将来 now,past-tense,ago,recently, soon, a little while 空间Topology,Dimension,Orientation & Shape,Length, area, volume,Lat/long, elevation 时间和事件at-time(e,t) during(e,T) time-span-of(T,e)

23 用逻辑描述基本概念:时间和空间 now(t,u): instant/interval
t is now in utterance/document u today(d,u) <--> now(t,u) & in-interval(t,d) & day(d,n,x) past(t,u) <--> now(t1,u) & before(t,t1) ago(t,T,u) <--> now(t1,u) & interval-betw(t,t1) = T

24 用于构造复合概念的构造子 使用一组构造子constructors 复合概念 :∪、 ∩、 ~非、 概念的约束: 、、≡
概念的约束: 、、≡ 概念C受到关系R的限制: R.C; R.C; 陈述例hasChild. FemalePerson  hasChild.FemalePerson hasChild是关系R, 陈述:至少有一个女孩子,全是女孩子 概念类的个数约束 (> 3 hasChild)  (< 2 hasFemaleRelative) 有三个以上孩子, 至少有一个是女的亲属 构造子是对概念予以约束(语义约束)的手段

25 用受限的一阶谓词逻辑,DL描述逻辑 词语的定义和词语间的二元关系 原子类 atomic class, 复合类 cmpsite class,
角色 role 二元谓词,例如,父子关系 原角 atomic role,父-子 逆角 inverse rolev,子-父 描述逻辑DL的特点是语义表达能力有限,推理规则简单,在限制表达能力的条件下,可以获得多项式复杂性的推理算法

26 Web of Ontologies 目录 web 为什么需要 ontology 构建onto(特别是领域性的onto)究竟是
onto面对web新情景 构建onto(特别是领域性的onto)究竟是 着重于反映现实, 还是着重于制定规范? 逻辑及 DL描述逻辑在onto搭建中的作用 Web of Ontologies 半自动的构建onto 目录 许卓群 北京大学 信息科学技术学院 网络与信息系统研究所

27 挑战,Web of Ontologies 全球onto网
全球知识网 不同于相对集中的词库、字典库 分布式的建设: 语义冲突消解, 语义深度层次的划分:高等理论水平的ontologies层应该首先建设 半自动构建 web 网站的Ontology

28 半自动构建Web Ontology的挑战: 用经济学的术语, 在Web上Ontology的生产,流通和消费 三环节
挑战之二,在改变Web文本内容的同时,维护Web Ontology的同步变化。避免Ontology成为过期的废信息。 挑战之三,如何把遗产似的网站补充配备onto Web Ontology的传递和流通: “方言” Ontology,以及Ontology门户站 Web Ontology的使用和消费: 超越传统browser的客户端 人机交流ontology, 把语义自动变为机器可读的Ontology

29 Ontologies的更新和互相引用 Ontology Mapping
有一个单位A要编制自己的业务的ontology,并发现一个onto-B很类似,其中80%的概念词语(tags)是A可以采用的,但20%必须另行定义,怎么办? Ontology Mapping 把别人的onto尽可能地映射过来, 例如,知网上的词语的语义关系, 如何为另一个具有onto的系统所用 建造Ontology的过程是选择复用对象,一大抄的过程,抄得合适不合适是学问 建造Ontology需要理论和适用工具 需要工具平台的建设Ontologies 的互相利用,保持语义的变换映射,比较检验等

30 从web提出Onto更新的触发请求 --本体如何被自动更新、半自动更新
新单词:从网站web pages的文本集合中,从词语的统计出现,提取出新单词和老概念之间的候选语义关系, 统计性的词语聚类加上词语语义分析,获得新单词在某种语境下和其他单词的co-occrrnce,以及 新单词出现次数与它在onto中的重要性。 Ontology Merging Stanford大学的Chimaera ,《An Environment for Merging and Testing Large Ontologies》 Stanford大学的Prompt,《The PROMPT Suite: Interactive Tools For Ontology Merging And Mapping》 Washington大学的Glue 参考文献:《Learning to Map between Ontologies on the Semantic Web》

31 从web提出Onto更新的触发请求 --本体如何被自动更新、半自动更新
Onto Merging Onto Mapping 取一个onto,寻找和匹配matching另一个onto的语义雷同的对应部分 取该onto的适当部分补充到另一个onto的对应部分 Ontology Merging n Mapping Stanford大学的Chimaera ,《An Environment for Merging and Testing Large Ontologies》 Stanford大学的Prompt,《The PROMPT Suite: Interactive Tools For Ontology Merging And Mapping》 Washington大学的Glue 参考文献:《Learning to Map between Ontologies on the Semantic Web》

32 谢谢! 感谢诸位领导和诸位专家 References 01
[Asunción Gómez Pérez. 2002] A Survey on Ontology Tools. OntoWeb Consortium, 31 May

33 References 02 [TOVE 2003] [Y. Sure, M. Erdmann, J. Angele, S. Staab, R. Studer, and D. Wenke. 2003]. OntoEdit: Collaborative ontology engineering for the semantic web. In International Semantic Web Conference 2002 (ISWC 2002), Sardinia, Italia. 2003


Download ppt "Web of Distributed Ontologies"

Similar presentations


Ads by Google