中文发现系统进展与应用 叶艳鸣
海量资源带来的困惑 基于知识挖掘的发现
海量资源带来的困惑 ——由一组数字说起
估计现在一年全世界所产生的新信息量大约有 4千万万亿(4X1019)字节 引自Howie DiBlasi的“你知道吗”
这超过了人类过去 五千年信息量的总和 That is more than in the Previous 5,000 years.
人类的学习和阅读迈进“无纸化时代”
数字学术资源浪潮 >1万个 数据库
疑惑 引自电子科技大学图书馆 秦鸿
我们如何面对?
基于知识挖掘的发现系统
——杨晓光(北京航空航天大学航空推进系教授航空宇航推进理论与工程学科博士生导师、图书馆馆长) 发现的意义 ——杨晓光(北京航空航天大学航空推进系教授航空宇航推进理论与工程学科博士生导师、图书馆馆长) 意外惊喜 洞察全局 价值再生 台词:引文分析包括中文图书被引用分析和中文期刊被引用分析 11 11
国外主要发现系统
300家 400家 600家
国外发现系统的中文资源量
中文资源量在summon和超星发现系统中对比 测试时间:2012年7月
中文资源量在primo和超星发现系统中对比 测试时间:2012年9月7日
中文资源量在EDS和超星发现系统中对比 通过检索词“文化”进行对比 EDS 超星发现系统 测试时间:2012年9月5日
中文发现系统
西安交通大学 图书馆首页
全面地发现中文资源
元数据更新:两次/周 空检索 344万篇学位论文 452万种图书 378万篇会议论文 7690万篇期刊 54万篇标准 1亿篇报纸文章 767万篇专利 10亿个网页 200万部视频
12年12月1日数据量
13年2月1日数据量 每月更新300万条
精准地发现中文资源
10亿条引文数据 专业级强大词表库支持精准发现 40万主题词表 600万作者库 30万机构库 8万同义词表 20万刊名表 3500条学科分类表 20万刊名表 600个数据库收录来源表 2500万学术 专业词库 重要索引库 10亿条引文数据
完善的中文引证分析
参考与引证
文章被引用的生命期
区分他引与自引 自引与他引
引文分析 实现期刊-期刊到图书-图书、图书-期刊、期刊-图书的引用分析 完善中文期刊引用分析: 4000万到7600万 提供作者、出版社、刊名、作者单位、主题词、 学科、分类等的引用分析 最终实现图书、期刊、学位论文、会议论文……之间互引的立体引用分析 台词:引文分析包括中文图书被引用分析和中文期刊被引用分析 31 31
详细的分面功能
馆藏分面 类型分面 关键词分面 年代分面
作者分面 全部可复选 作者机构分面 二级分类可展开 核心期刊分面
可视化的知识关联显示
可视化按钮
知识点与知识点的关联 检索图书馆 点击 图书馆管理
知识点与知识点的关联
知识点与人的关联 检索图书馆学 点击作者 吴慰慈
人与人的关联 点击作者 罗志勇
罗志勇的相关文章 点击该学术文章
知识关联的意义在于发现 人与人、人与知识、知识与知识、机构与人、机构与机构等之间的相互关系。
学术趋势分析
手扶拖拉机:一个不靠谱的领域
网格计算与云计算发展相关性分析
湖南大学的学术发展趋势分析
同类院校中的地位
智能的辅助搜索 台词:引文分析包括中文图书被引用分析和中文期刊被引用分析 50 50
单位:北京航空航天大学 作者:杨晓光
检索关键词“二氯丙酸” 同时检索了“茅草枯”
检索“生态服务系统” CA、国内统计来源刊、 国内核心期刊收录
与全文获取系统的无缝对接
无缝对接 OPAC: 本馆纸书 数据库: CNKI、万方、维普、方正…. 发现系统 读秀: 图书补缺 共享联盟: 稀缺文献补缺
数据库 百链 读秀
成功传递126,194笔请求 成功传递126,194笔请求
发现系统不是简单的整合 发现系统是知识挖掘与数据分析
从资源到知识的发现层次观 目录级发现 文献级发现 知识级发现
知识发现的主要方向 ……
三、发现系统功能构想
资源补缺 云服务 知识挖掘 数据分析 整合 百链
国内中文发现系统应用情况
39所985院校中 有30所采用超星中文发现系统 !
电子科技大学 北京航空航天大学 天津大学
北京师范大学 哈尔滨工业大学
吉林大学
谢 谢