Presentation is loading. Please wait.

Presentation is loading. Please wait.

张振海 清华同方光盘股份有限公司 软件研发中心 珠海

Similar presentations


Presentation on theme: "张振海 清华同方光盘股份有限公司 软件研发中心 珠海"— Presentation transcript:

1 张振海 清华同方光盘股份有限公司 软件研发中心 2001-12-21 珠海
CNKI知识仓库建设与服务标准 张振海 清华同方光盘股份有限公司 软件研发中心 珠海

2 什么知识仓库? 是面向一类具有相同知识信息需求的机构,根据其需求的知识结构特征和层次范围,从指定的信息源中筛选、分类、编辑而成的,通过各种媒体进行动态更新的数据库。

3 知识仓库的目标? 实现知识资源共享 提高知识传播的速度 降低知识使用成本 支持知识创新 为开展规模化知识服务提供支持

4 知识仓库的结构 领域专家 专业知识库 教材专著库 知识元库

5 知识仓库结构图 专业知识库 专业知识库 专业知识库 知识元库 专著教材 知识元 知识元 工具书 专业知识库

6 知识库知识元关联 知识元 相关知识元关联 知识元引用自动关联 通过知识元关联使知识仓库成为有机整体
对某一知识的完整描述叫知识元,如概念、定理、定律、事实、历史人物、历史事件 相关知识元关联 知识元引用自动关联 通过知识元关联使知识仓库成为有机整体

7 知识仓库的优势 快速实现资源共享 提高资源开发利用层次 实现“沉浸式”学习与研究环境 加快资源开发速度 提高知识交流速度

8 元数据 元数据—描述数据的数据(strutured data about data) 主要元数据标准: 元数据描述的层次
CDWA(27), DC(15), EAD(TEI)(21),FGDC(460), GILS(22-43), TEI(20),VRA(17-38) 元数据描述的层次 很简单:传统搜索引擎 中间:Dubin Core,15元素 复杂:Marc , FGDC

9 CNKI元数据 国际接轨 简单和复杂兼顾 可扩展 以Dulin Core为基础的面向对象的CNKI元数据方案
扩展性好 应用适应性好 在文献对象描述上可以和DC较好的对应

10 XML:资源交换格式 XML XML是eXtensible Markup Language(可扩展的置标语言)的缩写,是W3C组织发布的标准。W3C组织制定XML标准的初衷是,定义一种互联网上交换数据的标准。W3C采取了简化SGML的策略。不仅可以通过XML 来创建标记语言,而且能够创建高度结构化的标记语言,其采用纯文本格式,具有很好的交换性,使其成为开展以内容为核心的 元数据应用的首选描述语言 DTD: Document Type Definition XML Schema 支持多种数据类型

11 RDF的描述结构 RDF的数据模型可以用有向图描述:
Ora Lassila is the creator of the resource 三元组(S(Subject),P(Predicate),O(Object)) Subject : Predicate: Creator Object :Ora Lassila

12 RDF优势 资源发现:提供更好的搜索引擎性能 智能代理软件:可以促进知识共享和交换的自动化 内容分级 知识产权 电子商务 协同工作

13 CNKI知识仓库服务平台目标 传统资源开发模式 CNKI 知识仓库开发模式 优点 一种资源 + 一种软件的模式 软件资源分离模式
统一软件平台 各种知识库 优点 降低开发成本,缩短开发周期 提供集成服务,方便用户使用 提高服务品质

14 服务平台结构—支持知识协作 Web Gate 内容创建管理 互连协议 网上交流:网络视频会议系统 内容挖掘 对象管理系统 知识元库
专业知识库 搜索引擎 自然语言处理 专著教材 用户管理 安全管理

15 服务平台功能 知识仓库管理:面向对象的知识库管理系统 传统检索 智能全文检索 支持相关度排序,多语言扩展。 面向对象的检索 自然语言检索接口
知识库创建,知识元创建 多种类型对象支持:文本,音频,视频等 传统检索 精确检索 智能全文检索 支持相关度排序,多语言扩展。 面向对象的检索 自然语言检索接口

16 模式驱动的知识需求的描述—问题视图 研究背景 著名研究人员 资料出处:期刊,报纸,会议 行业重要活动 行业重要基金 活要研究人员
最近两年进展 相关知识准备

17 内容挖掘 动态聚类 自动分类 概念关联分析 自动标引 自动文摘 对查询结果进行动态划分 对文本对象进行归类 分析概念间的关联关系,如共现关系
为文本对象产生文摘

18 个性化服务 用户模式分析 用户需求定制 内容推送服务 分析用户在知识仓库中的行为模式 用户提出自己的知识需求描述
根据用户行为模式,以及用户定制的需求

19 工具服务 词典管理 自动分词 主题词表管理 多语言词典管理 汉语分词词典 自动分词算法 自定义分词算法 汉语主题词表 行业主题词表
中英自动翻译:单词,专业词汇,120万英汉字典支持

20 支持开放系统互连协议 目标:分布式异构数据库互连。提供集成知识服务 ANSI/NISO Z39.50 OAI XML –Query
Information Retrieval Application Service Definition and Protocol Specification OAI The Open Archives Initiative Protocol for Metadata Harvesting XML –Query Open URL

21 感谢各位专家!


Download ppt "张振海 清华同方光盘股份有限公司 软件研发中心 珠海"

Similar presentations


Ads by Google