Presentation is loading. Please wait.

Presentation is loading. Please wait.

海量资源带来的困惑 基于知识挖掘的发现. 海量资源带来的困惑 基于知识挖掘的发现 海量资源带来的困惑 ——由一组数字说起.

Similar presentations


Presentation on theme: "海量资源带来的困惑 基于知识挖掘的发现. 海量资源带来的困惑 基于知识挖掘的发现 海量资源带来的困惑 ——由一组数字说起."— Presentation transcript:

1

2 海量资源带来的困惑 基于知识挖掘的发现

3 海量资源带来的困惑 ——由一组数字说起

4 估计现在一年全世界所产生的新信息量大约有 4千万万亿(4X1019)字节
引自Howie DiBlasi的“你知道吗”

5 2011年 全球信息总量突破 1.8千万亿兆字节 资料来源:IDC,http://www.emc.com/digital_universe.
5

6 这超过了人类过去 五千年信息量的总和 That is more than in the Previous 5,000 years.

7 新的科学技术知识 大约每2年翻一番

8 人类的学习和阅读迈进“无纸化时代”

9 数字资源浪潮 >1万个 数据库

10 疑惑 引自电子科技大学图书馆 秦鸿

11 我们如何面对?

12 基于知识挖掘的发现系统

13 发现的意义 意外惊喜 洞察全局 价值再生 ——杨晓光 北京航空航天大学航空推进系教授 博士生导师 图书馆馆长
台词:引文分析包括中文图书被引用分析和中文期刊被引用分析 ——杨晓光 北京航空航天大学航空推进系教授 博士生导师 图书馆馆长 13 13

14 国外主要发现系统

15 300家 400家 600家

16 国外发现系统的中文资源量

17 中文资源量在summon和超星发现系统中对比
测试时间:2012年7月

18 中文资源量在primo和超星发现系统中对比
测试时间:2012年9月7日

19 中文资源量在EDS和超星发现系统中对比 通过检索词“文化”进行对比 EDS 超星发现系统 测试时间:2012年9月5日

20 超星发现系统

21 西安交通大学 图书馆首页

22 全面地发现中文资源

23 元数据更新:两次/周 空检索 344万篇学位论文 452万种图书 378万篇会议论文 7690万篇期刊 54万篇标准 1亿篇报纸文章
767万篇专利 10亿个网页 200万部视频

24 12年12月1日数据量

25 13年2月1日数据量 每月更新300万条

26 精准地发现中文资源

27 10亿条引文数据 专业级强大词表库支持精准发现 40万主题词表 600万作者库 30万机构库 8万同义词表 3500条学科 分类表
20万刊名表 600个数据库收录来源表 2500万学术 专业词库 重要索引库 10亿条引文数据

28 完善的中文引证分析

29

30 参考与引证

31 文章被引用的生命曲线 《图书馆学导论》于良芝 2003 科学出版社

32 区分自引他引 自引量(3) 自引用

33 引文分析 实现期刊-期刊到图书-图书、图书-期刊、期刊-图书的引用分析 完善中文期刊引用分析: 4000万到7600万
提供作者、出版社、刊名、作者单位、主题词、 学科、分类等的引用分析 最终实现图书、期刊、学位论文、会议论文……之间互引的立体引用关系 台词:引文分析包括中文图书被引用分析和中文期刊被引用分析 33 33

34 灵活的分面分析功能

35 馆藏分面 类型分面 关键词分面 年代分面

36 作者分面 全部可复选 作者机构分面 二级分类可展开 核心期刊分面

37 可视化的知识关联图谱

38 可视化按钮

39 知识点与知识点的关联 点击数据仓库

40 知识点与知识点的关联

41 知识点与人的关联 检索“图书馆学” 点击作者 吴慰慈

42 人与人的关联 点击作者 罗志勇

43 点击该学术文章

44 不同时期图书馆学领域高产出作者变化 1990—1995年 2009—2013年

45 不同时期图书馆学领域研究热点变化 2009—2013年 1990—1995年

46

47 知识关联的意义在于发现 人与人、人与知识、知识与知识、机构与人、机构与机构等之间的相互关系。

48 学术趋势分析

49 java研究变化趋势

50 多主题分析 网格计算与云计算发展相关性分析

51 手扶拖拉机:一个不靠谱的领域

52 湖南大学的学术产出趋势分析

53 清华大学的专利情况

54 智能的辅助搜索 台词:引文分析包括中文图书被引用分析和中文期刊被引用分析 54 54

55 单位:北京航空航天大学 作者:杨晓光

56 检索关键词“二氯丙酸” 同时检索了“茅草枯”

57 检索 “生态系统服务” CA化学文摘(美)收录 国内统计源收录 国内核心期刊收录 引证文章

58 无缝对接各类全文获取系统

59 无缝对接 OPAC: 本馆纸书 数据库: CNKI、万方、维普、方正…. 发现系统 读秀: 图书补缺 百链: 期刊等文献补缺

60 数据库 百链 读秀

61 发现系统不是简单的整合 发现系统是知识挖掘与数据分析

62 从资源到知识的发现层次观 目录级发现 文献级发现 知识级发现

63 知识发现的主要方向 ……

64 三、发现系统功能构想

65 超星发现系统相关专利

66 超星发现系统 500台服务器 1.2PB存储 8T内存 4000个CPU核心 10亿引文 2亿中文元数据 超星分布式存储 200名研发人员
4个研究所 7年搜索与挖掘 200亿级搜索引擎 10亿数据实时分析 30000并发/毫秒级

67 资源补缺 云服务 知识挖掘 数据分析 整合 百链

68 发现系统院校展示

69

70

71 北京航空航天大学 天津大学

72 北京师范大学 哈尔滨工业大学

73 吉林大学 电子科技大学

74 39所985院校中 采用超星发现系统已经有31所!

75

76

77 意外惊喜 洞察全局 价值再生 超星发现为创新插上飞翔的翅膀

78 谢 谢


Download ppt "海量资源带来的困惑 基于知识挖掘的发现. 海量资源带来的困惑 基于知识挖掘的发现 海量资源带来的困惑 ——由一组数字说起."

Similar presentations


Ads by Google