中国生物医学文献服务系统SinoMed 李军莲 医学知识组织研究室 2014-10-16
科研信息环境变化 信息爆炸 数据洪流 大数据 数据爆炸 海量数据 eScience 海量信息 信息海洋 信息泛滥
国内外文献服务系统的发展趋势 提升知识服务能力 检索功能智能化 链接功能实用化 检索 统计 分析评价一体化 全文获取多样化 收录资源扩大化 个性化 服务 人性化 提升知识服务能力
20年发展历程 专注医学 精益求精 2014年 2013年 2010年 2008年 2004年 2000年 1999年 1995年 推出 全新镜像版和移动版,提升面向机构的个性化知识服务能力 2013年 推出“中文引文库”,开展“引文检索”与“学术分析”服务 2010年 增加“智能检索”功能;开展机构规范、基金规范研究与实践 专注医学 2008年 研发中国生物医学文献服务系统 SinoMed,整合西文文献,开展全文服务,实现与维普全文的无缝链接 2004年 - 全面升级浏览器版,探索与维普的全文链接 2000年 - 加入“引文数据” 精益求精 1999年 推出浏览器版CBM 1995年 开展自动标引技术研究与实践 1994年 - 开发研制“中国生物医学文献 光盘数 据库”(CBMDisc)
基于CBM,打造国内生物医学领域不可替代的检索、分析评价系统 创新目标 信息工作者 资源 数据 功能 服务 基于CBM,打造国内生物医学领域不可替代的检索、分析评价系统 医务人员 科研管理人员 创新思路 能力&效果
创新思路 提升知识服务能力 保全资源 规范数据 优化功能 拓展服务 增加资源种类 保障收录资源质量 内容深度标注 引文规范 期刊规范 著者/机构规范 基金规范 优化功能 快速检索 高级检索 智能检索 主题检索 著者检索 机构/基金检索 引文检索 拓展服务 引文服务 全文链接服务 原文传递服务 学术分析 个性化服务 提高资源保全率 扩大数据规范的深度、广度 优化功能 拓展服务 提升知识服务能力
SinoMed资源 建设中文引文库、协和博硕学位论文库 拓宽收录期刊语种,增加西文资源 整合OA资源、知识型资源 中 文 资 源 西 资源 文献:820余万篇 年代:1978年以来 期刊:1800余种,其中生物医学核心期刊近 800种,中华医学会期刊123种 文献:2400余万篇,免费310余万篇 期刊:7200余种 中 文 资 源 西 资源 SinoMed资源 引文:460余万篇 年代:1989年以来 类型:期刊、图书、会议等 期刊:生物医学相关期刊 1700余种
保障收录资源质量 医学科普类期刊文献 会议通知、征文、启事、广告等信息 每年被遴选掉的文献 约合8-9万篇。 交叉学科期刊中与医学无关的文献 每年被遴选掉的文献约10万篇。 每年被遴选掉的文献 约合8-9万篇。
以北京协和医院著名专家“郎景和”为例,检索其发表文献量及第一著者发文量。 每年被遴选掉的文献约10万篇。
扩大数据规范的深度、广度 数据 文献题录 文献引文 引文查重 引文规范 统计处理 内容主题标引 内容分类标引 期刊规范 机构规范 基金规范 作者规范 文献引文 引文查重 与题录关联 题录重要信息回带 统计处理 引文规范
规范一:基于CUMLS的文献内容深度标注 中 文 一 体 化 医 学 语 言 系 统(含CMeSH) 主题-分类映射表 医学语料库 分 词 自然语言-规范语言映射表然 抽取篇名、文摘、关键词 ……. 文献库 副主题词映射 特征词映射 主题词映射 加 权 主题-分类映射 完成标引、入库 文章 主题内容 学科分类
规范二:参考文献的查重归并、映射关联 统一著录 查重归并 关联题录 题录重要信息回带 被引次数、施引文献统计 1200余万篇引文 460余万篇 引文
规范三:对机构进行规范处理,建立机构知识库 解决机构著录不统一问题 机构著录形式多样 全称、各种简称、错误、…… 机构变更 更名、合并、拆分…… 同名异构 机构歧义,不同地区相同机构 名称 构建机构 知识库
规范三:对机构进行规范处理,建立机构知识库 清 洗 清 洗 初步规范 深度规范 三个层次 遵循“由低到高”的优先顺序支持在服务系统中的应用。 是对发文机构规范处理的结果,分三个层次:清洗、初步规范和深度规范,遵循“由低到高”的优先顺序支持在服务系统中的应用。
机构规范工具 计算机辅助 人工审核 数据源 机构规范库已有规模 规范机构名:78330条 医院类:42446,包括全部三甲和二甲医院 中文生物医学文献数据库CBM中所有中文作者机构 计算机辅助 机构规范库已有规模 规范机构名:78330条 医院类:42446,包括全部三甲和二甲医院 高等院校:29425,规范到二级机构“学院” 国家省部级,中科院重点实验室:2277 其他:4182 规范别名:306357条 *已完成187万余原始记录的清洗与加工 人工审核
机构知识库建设 医院类机构规范结果示例
高校/研究所类机构机器规范结果示例
国家/省部级实验室机器规范结果示例
规范四:对基金进行规范处理,建立基金知识库 已完成所涉基金数据的著录、自动清洗分类、人工审核等规范化处理; 共处理95万基金数据; 生成1.5万规范基金名称,4.8万基金别名。
基金别名4万余条 基金知识库建设
基金别名4万余条 基金知识库建设
SinoMed 检索服务 基于文献内容的检索 新增 检索功能 智能检索 双语检索 一站式查询 说清楚 引文 作为资源整合的部分来体现
智能检索:在词表系统支持下,系统自动将用户输入的检索词转换成表达同一概念的一组词进行查询,是基于自然语言的主题概念检索。
智能检索:检出文献量远多于非智能检索,为非智能检索的7倍。
主题检索:基于CMeSH采取规范化主题词基于主题概念进行的检索,具体包括主题词加权扩展检索、主题词加权检索、主题词/副主题词检索等形式。
跨语言检索:基于CMeSH,支持中-英双语直接检索。
机构检索 机构 知识库
基金检索 基金 知识库
限定检索
检索结果自动分组与聚类
知识链接:深度析取文献知识单元,提供丰富知识链接。 哪些文章引用了我? 我和谁引用了相同的文章? 知识链接 作 者 出 处 关键词 主 题 词 参考文献 施引文献 共引文献
拓 展 服 务
引文检索服务
原文服务:提供灵活多样的原文获取途径:在线浏览、直接链接下载、电子馆藏直接调用及通过原文传递服务系统进行原文索取。 更多 原文链接
依托引文数据及机构/基金/期刊等规范知识库的建立,提升CBM的统计分析功能,辅助科研评价。
引证分析
作者分析与评价
机构/第一机构分析 完成CBM收录文献中600余万机构名称的清洗、分类,解决了同一机构不同变体问题 辅助了解制定机构的核心研究领域、核心研究人员、主要合作机构、论文产出情况和被引情况
期刊分析
基金分析
提供独立个人空间,保存有价值的检索策略,订阅关注领域的新进展、储存感兴趣的检索结果、提供个性化的写作助手、跟踪指定文献被引情况,帮助您及时查看系统登录利用情况。 我的 空间 检索策略 订阅 数据库 写作助手 反馈 使用统计 引文跟踪
结 束 语 做检索查新人员、医务工作者、科研管理人员 的好助手! 目标:为用户提供快捷、精准、全面的检索结果 保全资源 规范数据 拓展服务 增加资源种类 保障收录资源质量 规范数据 内容深度标注 引文规范 期刊规范 著者/机构规范 基金规范 优化检索 功能 快速检索 高级检索 智能检索 主题检索 著者检索 机构/基金检索 引文检索 拓展服务 引文服务 全文链接服务 原文传递服务 学术分析 个性化服务 提高资源保全率 扩大数据规范的深度、广度 优化功能 拓展服务 目标:为用户提供快捷、精准、全面的检索结果
IMICAMS 知识服务系列 SinoMed CMKB CMeSH MWA 中文生物医学文献服务系统 临床医学知识库 中文医学主题词表 医学写作助手
感谢聆听,感谢支持!