Download presentation
Presentation is loading. Please wait.
1
火电运维技术知识库 技术报告 主讲人:张林林 同方知网(北京)技术有限公司 2015年1月
2
目 录 1 产品服务模式介绍 2 应用技术及专利介绍 3 后台管理系统
3
一、产品服务模式介绍
4
1.1 服务模式——云租用 服务模式 用户使用方式 典型适用环境 特点分析 云租用
1.1 服务模式——云租用 服务模式 用户使用方式 典型适用环境 特点分析 云租用 账号登录:读者使用账号直接登录火电运维技术知识库,可不限次数下载本单位订购的全文数据库; IP 自动登录:在用户单位的IP 范围内可直接登录火电运维技术知识库,不限次数下载本单位订购的全文数据库。 用户可直接访问互联网,电厂职员可在业余场地使用。 更新及时:可使用火电运维技术知识库最新、最完整的内容及系统技术; 避免硬件投入,节省硬件及人工维护成本。
5
1.2 服务模式——镜像 服务模式 用户使用方式 典型适用环境 特点分析 镜像
1.2 服务模式——镜像 服务模式 用户使用方式 典型适用环境 特点分析 镜像 用户可将订购的数据库安装到本地,本单位读者在内网上使用所订数据库; 知识库数据资源采用光盘更新、网络更新、上门月更新。 用户内部网完善,可实现内网访问,直接在电厂使用。 访问速度不受外网条件限制; 可永久保存数据库作为馆藏; 可对镜像资源进行二次开发; 支持与内部其他系统进行关联。
6
1.3 服务模式——云托管 服务模式 用户使用方式 典型适用环境 特点分析 云托管
1.3 服务模式——云托管 服务模式 用户使用方式 典型适用环境 特点分析 云托管 账号登录:读者使用账号直接登录火电运维技术知识库,可不限次数下载本单位订购的全文数据库; IP 自动登录:在用户单位的IP 范围内可直接登录火电运维技术知识库,不限次数下载本单位订购的全文数据库;用户可将订购当年的数据库安装到本地,并具有永久保存权与使用权。 用户单位既可直接访问互联网,又有完善的内部网,可实现内网访问。 更新及时:可使用火电运维技术知识库最新、最完整的内容及系统技术; 使用方便:可内外网同时使用; 可永久保存数据库作为馆藏;可对镜像资源进行二次开发; 支持与内部其他系统进行关联。
7
二、应用技术和专利介绍
8
详细部署方案
9
公司自主研发了中文技术非结构化文档数据库,实现超大数据库的管理与检索。最大数据量可达10T,达到平均500g/s的检索速度,可实现全球10万人同时在线检索。
充分发挥知网技术优势,注重数据库的底层开发,知识元库的开发,尤其注重最终用户的使用模式和使用习惯,并将其结合到软件工具中,提供分组排序、知网节等技术,辅助用户的技术分析工作。
12
技术1—自建资源库、异构资源库整合发布及检索
技术2--知识元提取技术,多维度进行知识服务 技术3--知网节技术,形成完整的知识网络 技术4--跨库、跨语言检索技术 技术5--个性化定制及动态推送技术 技术6—海量非结构化知识库管理系统(KBase)
13
机构平台整合工具: 技术1—自建资源库、异构资源库整合发布及检索 SDIP自建数据库整合发布系统
针对有自建库整合需求的用户。要求自建资源已经成库,利用常规的数据库管理系统进行管理 异构资源整合发布系统 针对有多种外购资源库的用户。实现多种中外文资源库的“一站式”跨库检索。 KDE镜像版二次开发接口 针对有开发统一检索平台需求,并需要调用CNKI资源库的用户。
14
技术1—自建资源库、异构资源库整合发布及检索
针对本单位积累的自有文献资源和外购资源提供一整套解决方案,针对引进资源数据异构、类型多样、平台软件各异、部署使用与认证计费各不相同、资源之间缺乏相互链接机制等一系列问题,提供了一揽子解决解决方案。 资源整合模块为用户提供了同构资源整合和异构资源整合方案。同构资源,基于CNKI自主知识产权的全文检索数据库Kbase的资源;异构资源,给予非CNKI全文检索数据的资源,如:SqlServer、Oracle、MySql、DB2、Access的数据库资源。针对用户实际情况,我们提供了5种资源整合方案SDIP、ADO、OpenQuery、Z3950/OpenURL、Web访问方式。
15
整合方式 整合对象 特点 SDIP 允许将数据资源发布到CNKI自有资源库的资源。 可以是: 1、用户自有的数据库资源; 2、用户自有软件系统中的数据库资源; 深层次的数据库整合; 将用户成库资源发布到CNKI机构数字图书馆的自有资源中,参与CNKI资源跨库检索和统一结果显示;支持格式:Kbase、SqlServer、MySql、Access、Excel、文本、Oracle数据格式; 支持简单检索、标准检索和高级检索; 数据库访问 (ADO) 允许直接访问数据库的资源。 支持: 3、购买的其他数据库厂商的镜像数据库资源 较深层次的数据整合; 通过获取目标数据库的访问权限,根据目标数据库的SQL特点,实现统一数据库检索;支持格式:SqlServer、MySql、Access、Oracel格式; 支持简单检索; 检索结果效果和检索速度同目标数据库质量有关; 数据影射和配置较复杂; 系统稳定性较好; OpenQuery 提供公开检索题录数据接口的资源。 1、购买的其他数据库厂商的镜像数据库资源 浅层次的数据整合; 根据数据库厂商提供的OpenQuery接口协议检索资源; 检索质量取决于OpenQuery提供的接口质量; 检索结果显示影射负责; 系统稳定性和数据库厂商接口关系很大,稳定性较差;
16
整合方式 整合对象 特点 OpenUrl/Z3950 支持OpenURL/Z3950协议的数据库资源。 支持: 1、购买的其他数据库厂商的镜像数据库资源 浅层次的数据整合; 根据标准的整合协议的资源整合; 支持简单检索; 检索质量和检索结果取决于数据库厂商的检索算法; 稳定性一般; Web访问 能直接访问Web的资源,可以是用户外购资源和用户成系统资源 2、购买的其他数据库厂商的外网数据库资源 通过模拟用户访问Web系统,根据目标系统(平台)特点,用正则表达方式匹配网页检索结果,实现统一资源检索; 检索结果效果和检索速度同目标系统(平台)质量有关; 配置Web资源操作复杂,需要配置人员多次测试才能配置成功; 系统稳定性差;
17
“一站式”检索: CNKI数据库资源 单位自建资源 单位外购资源
18
跨库检索全面超越了以往的单一的、面向单库的检索方式,真正实现了“一站式”检索。满足文献调研与情报分析对查全查准率需要。
同时,实现跨库检索的同时,我们也提供许多评价技术,分析技术,以及数据的筛选技术, 比如统一跨库检索,在全库中检索聚乙烯,左侧会给大家提供,期刊23513篇,论文。。。专利。。。。。我们重点关注专利、 我们可以直接点击查找,方便大家使用,搜索聚乙烯的时候,还可以看到各大学发表了多少论文的统计, 18
19
技术2--知识元提取技术,多维度进行知识服务
以CNKI现有学术资源为依托,利用自然语言处理技术,自动从文献中抽取概念、图片、创新点、数值、表格等各类知识元。 知识元技术是CNKI独创的专有技术。在CNKI的作者库、引文分析库、文献标识、文献主题词、发文机构库等进行知识元的互相链接,并实现动态更新。 基于知识元链接技术,CNKI的检索能够针对用户当前的检索词提供检索词的相似词、相关词等,从而带给用户更多的文献信息。通过知识元的互相链接和挖掘,可以发现各个知识元之间的相互关系,并根据这种相互关联,得以创造新的知识,有利于用户的知识发掘。 一种基于Web数值表格抽取的数据挖掘方法 ——中国专利:CN ,
20
技术2--知识元提取技术,多维度进行知识服务
22
技术3--知网节技术,形成完整的知识网络 知网节是提供单篇文献的详细信息和扩展信息的浏览页面。它不仅包含单篇文献题录、摘要,还是该文献各种扩展信息的入口汇集点。这些扩展信息包括参考文献、引证文献、相似文献、读者推荐文献、相关作者、相关研究机构、分类导航等。 知网节是CNKI所独创的知识挖掘技术,已逐渐成为数据库开发的规范标准,是同方知网申请的一项专利。 文献资源知网节的展示结构 ——中国专利:CN , 基于知网节形式的学术知识表现方法 ——中国专利:CN ,
23
技术3--知网节技术,形成完整的知识网络
24
技术4--跨库、跨语言检索技术 制定总库统一的元数据标准,新加入的每一个数据库,都需要按相应元数据要求组织、制作和加工数据,实现总库内容整合,统一网络出版和统一跨库检索。 跨语言检索,基于千万量级学术多语言词典和高性能翻译引擎,自动匹配检索词与数据库语种,实现智能翻译和跨语言检索。帮助用户突破语言障碍,扩大外文资源服务层次。 检索结果提供多种分组排序工具,帮助读者进一步筛选内容。
25
围绕读者的研究领域和知识背景,构建个性化的文献调研和情报分析模型,系统第一时间自动推送信息、知识和情报。
技术5--个性化定制及动态推送技术 围绕读者的研究领域和知识背景,构建个性化的文献调研和情报分析模型,系统第一时间自动推送信息、知识和情报。 人找文献转变为文献找人;减少读者45%花费在信息搜索上的时间; 让读者专注于自己的科研创新和科研管理。 第三个,知网节技术 ,我们可以看这个图, 25
26
技术5--个性化定制及动态推送技术 利用个性化知识定制推送技术,完全改变传统知识检索方式,实现知识动态更新和自动推送,帮助火电厂用户方便、快速、准确地获取所需信息、知识、情报。目的在于不断提高使用者持续学习、知识挖掘及分析能力,从本质上提高用户的深化应用能力。
27
技术6—海量非结构化知识库管理系统(KBase)
28
一种基于整数映射的XML数据库全文索引方法
技术6—海量非结构化知识库管理系统(KBase) KBase全文数据库管理系统(简称KBase)是以管理海量的文本、网页、档案、文献、办公文档等非结构化数据为主,具备中文智能信息处理能力的国产数据库管理系统。KBase具有优异的全文检索性能和强大的海量非结构化数据存储管理能力,拥有超过500万词汇量的、大百科式的概念关系词典,具备业界领先的中文智能信息处理能力。Kbase数据库引擎已面向全国数千家机构用户服务,稳定性、检索速度、准确率都得到用户认可。 一种基于整数映射的XML数据库全文索引方法 ——中国专利:CN X,
30
三、后台管理系统
35
谢谢!
Similar presentations