ISI数据库分析工具功能与使用方法简介 肖仙桃 研究馆员 2017年3月7日
报告主要内容 ISI折射和引领网络文献数据库的发展趋势 为什么需要分析工具 Ei数据库提供的分析功能 ISI平台上的分析功能 Derwent data analyzer软件功能介绍
ISI折射和引领网络文献数据库的发展趋势 ISI Web of Knowledge 是一个基于 Web 而构建的整合的数字研究环境,通过强大的检索技术和基于内容的连接能力,将高质量的信息资源、独特的信息分析工具和专业的信息管理软件无缝地整合在一起,兼具知识的检索、提取、分析、评价、管理与发表等多项功能,从而大大扩展和加深了信息检索的广度与深度,加速科学发现与创新的进程。
ISI折射和引领网络文献数据库的发展趋势 在功能上,ISI Web of Knowledge 提供了强大的知识发现与管理工具,包括跨库跨平台的 CrossSearch、独特的引文检索、主题检索、化学结构检索、基于内容与引文的跨库交叉浏览、检索结果的信息分析、定题跟踪Alerting服务、检索结果的信息管理(EndNote, Reference Manager, ProCite, WriteNote) 等,帮助研究人员迅速深入地发现自己所需要的信息,把握研究发展的趋势与方向。
Web citation index 专利全文 外部信息资源 期刊全文 精选 Web内容 ISI Web of Knowledge是一个基于互联网建立的动态的、整合的数字研究环境,采用“一站式”服务,提供高质量的学术信息和研究工具,帮助研究人员获取、分析和管理研究信息。ISI Web of Knowledge采用“一站式”信息服务的设计思路构建而成,凭藉独特的检索机制和强大的跨库交叉检索能力,将来源于学术期刊、技术专利、会议录、化学反应、研究基金、网站资源及其它各种高质量信息资源整合在同一系统内,提供了自然科学、工程技术、社会科学、艺术与人文等多个领域中高质量的学术信息,兼具知识的检索、提取、管理、分析与评价等多项功能,从而大大扩展和加深了信息检索的广度和深度。通过ISI Web of Knowledge,即可由同一平台迅速检索各种不同的信息资源,世界范围内各个学术领域的渊源、变化、动态、走势及应用情况尽在掌握之中。 Web citation index
ISI折射和引领网络文献数据库的发展趋势 网络数据库的整体发展呈现出以下两个特点。一是数据库规模大、数据量多,增长迅速。如号称世界上最大学术电子出版物供应商的Elsevier Science,通过ScienceDirtect可在线提供多个数据库产品服务,包括一个综合性的学术期刊全文数据库、多个专题数据库、12种参考工具书及15个书目数据库,可检索、浏览的信息资源包括1500多种全文学术期刊、 5900万条文摘记录、2百万篇学术期刊论文。
ISI折射和引领网络文献数据库的发展趋势-续 数据更新速度快、周期短 检索结果的显示与输出灵活、多样 (1)检索结果的显示方式灵活、多样 主要表现在三个方面:一是每屏显示的记录数的限定;二是排序方式的多样化,可按相关度、出版时间、文献标题、著者、来源、语言、出版国等多种方式升序或降序排列。如INSPEC数据库检索结果的排序方式即多达10种;三是显示格式的多样化,可提供题录(Citation)、 题录+文摘(Citation+Abstract)、 全记录(Complete Field)或选择字段(Select Field)等多种格式显示。 (2)检索结果的输出方式多元化 不仅可提供存盘、 打印方式下载数据,且可利用E-mial发送检索结果,或将检索结果直接输出到文献信息管理软件,如ProCite 、Reference Manager、EndNote等中,亦或直接在网上订购文献全文。
ISI折射和引领网络文献数据库的发展趋势-续 数据库系统具有扩展整合功能 用户只需透过同一界面,即可迅速查到并获取自己所需要的信息。 (1)与图书馆馆藏的链接与整合 (2)与其他数据库的链接与整合 (3)与原始文献的链接 (4)与Internet 信息资源的链接 可提供相关电子信息服务 文献传递服务 定题服务 提供相关的信息分析
ISI折射和引领网络文献数据库的发展趋势-续 提供相关的信息分析 ISI平台最早提供分析功能,目前在SCI、SSCI、ISTP、CCC、BIOSIS PREVIEW、MEDLINE、INSPEC、DERWENT INNOVATION INDEX(DII)等数据库中能进行文献检索结果分析。 其他数据库系统也有的开始提供检索结果分析功能,如EI。
为什么我们需要分析工具?-原因之一 谁能读这么多? 谁需要读这么多? 发现与创新是不是一个数字的游戏? 知识发现:信息已经成为社会发展的三大重要资源之一。我们处在这样一个信息时代,即我们几乎被信息淹没,但仍感到知识的匮乏,因为大量的信息垃圾充斥其中,使我们很难从中得到解决问题所需的知识。我们首先面对的是如何管理信息中的知识,如何从数据中获取知识,如何利用大量信息发现知识,这就是我们今天所要讨论的知识发现。 “首先必需认识到,科研工作者都十分宝贵自己的时间,除极少数和自己工作关系十分密切的论文以外,绝大多数读者都不会阅读全文。” - 邹承鲁 “我的科学之路”,2003年10月
为什么我们需要分析工具?-原因之二 计算机辅助信息分析 随着计算机技术的发展及其在人类信息知识活动中广泛应用,计算机辅助信息分析Computer Aided Information Analysis ,CAIA) 作为一种崭新的方法和手段,于20 世纪70 年代以来开始在信息分析领域兴起,显著地改变了信息分析的方式和效率,提升了信息分析的职业水平。从发展趋势上看,CAIA 代表了信息分析发展的重点和未来方向。
为什么我们需要分析工具?-原因之二 CAIA 的兴起植根于以下两个背景:一是信息分析课题和方法本身对利用计算机所提出的迫切要求。随着经济社会生活的日益复杂化,信息分析所面临的对象多是复杂的大系统,统计、计算、建模、分析等各类信息数据处理越来越复杂,要求也越来越高,一些方法的参数和方程之多,建模和求解的难度之大,已非人的手工劳动所能胜任,甚至离开了计算机的辅助就不可能获得结果。二是计算机技术的发展为CAIA 奠定了技术基础。随着计算机功能的日益强大,以及数据库技术和软件技术的发展,现代信息技术不仅可有效支持对信息的组织和处理,而且还可支持对知识的识别、挖掘和重组,为解决信息分析中的各种复杂和困难的问题提供了非常强大的技术手段,对人的脑力劳动是一种智能意义上的重要补充。在上述背景下,CAIA 越来越受到人们的重视,日益成为信息分析的主流方法和手段,从而开辟出信息分析的新的工作方式和职业面貌。
为什么我们需要分析工具?-原因之二 虽然计算机辅助文献信息计量研究工作不如计算机辅助设计、计算机辅助制造甚至文献检索那样普及, 但事实上, 国外却早在进行这方面的研究, 尤其是在一些发达国家, 这一研究工作越来越受到图书情报界的重视, 而且获得了不少令人鼓舞的研究成果和进展。有的利用文献检索系统广泛开展文献信息的计量分析工作;有的建立了主要供文献信息计量分析使用的数据库; 有的统计软件已商品化, 正在广泛推广应用。在研究内容上,不仅涉及到分析理论、建库、扩充功能、程序设计等理论和技术问题, 而且其应用研究也十分广泛和活跃。
为什么我们需要分析工具?-原因之二 例如,美、俄、英、日等国利用专利文献数据库大力开展技术评价与预测工作。英国德温特专利公司在微机上对WPI 文献库进行多种分析与处理, 借助这种处理用户可以从化合物结构入手获得WPI 中的相应主题词、同义词, 最终获得专利, 还可以由此了解某公司拥有的专利的年代分布等情况。美国专利与商标局现在拥有一个庞大的专利文献数据库, 利用计算机对美国各个技术领域进行分析研究, 并定期出版各类研究报告, 或为特定用户编制专门的研究报告。美国科学情报研究所( ISI) 利用SCI 数据库进行文献的同被引聚类分析, 研究各国的科研状况、科学发展规律、人才评价等。俄罗斯也利用美国化学文摘(CA) 数据库和俄罗斯化学数据库分析高分子聚合物的世界专利的数量增长变化情况。日本通过INSPEC 和CA 数据库进行文献信息检索和统计分析, 用定量方法确定日本科研人员在物理、电工和化学领域的活动能力等。所有这些事实都说明计算机辅助的文献信息计量学研究不仅是完全必要的, 而且是切实可行的。这为我国开展计算机辅助的文献信息计量分析提供了可资借鉴的范例和成功经验。
为什么我们需要分析工具?-原因之二 通用软件一般都具有较完备的统计分析功能,可支持信息分析中常用定量方法的数据处理、计算和结果表达,如时间序列分析、回归分析、主成分分析、方差分析、因素分析、聚类分析、判别分析、多维比例分析、相关分析、曲线程序分析等。目前国内外已经开发和推出了不少统计分析方面的通用软件。 还有不少机构开发了专用分析软件,如ISI利用自己研制的文献计量分析系统进行文献计量分析研究,并生产了多个数据库产品,如ESI(ESSENTIAL SCIENCE INDICATORS)、JCR、ISIHIGHLYCIED.COM 目前还出现了一些商业化的分析软件,如INAS 专利分析软件、DERWENT DATA ANALYZER等。
为什么我们需要分析工具?-原因之二 INAS是由韩国元斯立株式会社研制的。它是基于Patent Map理论开发的,通过专利情报分析系统INAS和专利情报下载系统PatentGet,可以重新整合专利情报,用各种图形、报告和表格形式进行分类整理,进行各种分析,用于预测未来、指导采取相应对策,其推广应用将在知识产权审查管理领域、R&D开发、技术冲突诊断及对企业的专利战略、相关产业的发展发挥巨大作用。
EI分析功能使用方法简介 先进行检索
给出的就是检索结果分析
使用EI分析功能应注意 EI数据没有进行规范,因此,利用其分析功能应特别注意 EI数据只反映第一著者论文 只是一维的分析,不能进行二维、三维的分析 不能根据用户的需要,灵活定制。
ISI Web of Knowledge分析功能使用方法简介 输入检索词
进行检索结果分析
可以进行分析的字段:在不同数据库中可分析的字段是不一样的。在SCI中包括:著者、国家、语种、刊名、主题领域、文献类型、机构、出版年 指定显示结果数量 指定排序方式 指定显示超过一定数量的结果
以BIOSIS PREVIEW为例
可以缩小范围进行分析
ISI Web of Knowledge分析功能使用方法简介 不能根据用户的需要定制 分析的字段还不够丰富 不能进行二维三维分析
ISI利用分析工具开发的相关产品 Essential science indicators Special Topic In-cites Science Watch ISIhighlycited.com
Essential science indicators ESI(Essential Science Indicators)-基本科学指标数据库,是由世界上著名的学术信息出版机构ISI(美国科技信息所)于2001年推出的衡量科学研究绩效、跟踪科学发展趋势的基本分析评价工具,是基于ISI引文索引数据库Science Citation Index (简称SCI)和 Social Science Citation Index(简称SSCI)所收录的全球8500多种学术期刊的1000多万条文献纪录而建立的计量分析数据库。ESI从引文分析的角度,针对22个专业领域,分别对国家、研究机构、期刊、论文以及科学家进行统计分析和排序,主要指标包括:论文数、引文数、篇均被引频次。用户可以从该数据库中了解在一定排名范围内的科学家、研究机构(大学)、国家(城市)和学术期刊在某一学科领域的发展和影响力,确定关键的科学发现,评估研究绩效,掌握科学发展的趋势和动向。通过ESI可以系统地、有针对性地分析国际学术文献。作为ISI Web of Knowledge的一部分,ESI为科学研究者提供了一种动态的、综合的、基于网络的研究分析环境。
Essential science indicators ESI中的数据包括高被引率作者的排名、机构排名、论文排名(前1%)、国家排名(前50%)和期刊排名(50%),并有简要的说明指导用户如何进行数据分析,所有图表带有解释性的链接页面。ESI的另一个独特之处是提供被称为研究前沿的专业领域列表,该列表反映了当前正深入研究的和有突破性进展的科学领域。 ESI进行数据统计的范围仅限于ISI中做了索引的期刊的文章,不包括图书及其章节或ISI中未做索引的期刊中刊登的文章,也不对其出版数量和引文数量进行统计。
Essential science indicators ESI的特点: 综合全面的定量数据、清晰准确的统计以及与其他有价值的信息资源的链接。 ESI的功能: 1.分析特定研究机构、国家、公司和学术期刊的研究绩效; 2.在22个专业领域内分别对国家、研究机构、期刊、论文、科学家进行统计分析和排序; 3.跟踪自然科学和社会科学领域内的研究发展趋势; 4.评估潜在的合作者、评论家、同行和雇员; 5.测定特定研究领域的研究产出与影响; 6.提供与ISI Web of Knowledge的链接。
Essential science indicators ESI将学科领域分为22个大学科
ESSENTIAL SCIENCE INDICATORS功能与使用方法简介 进入ESI
按一定的方法分析出各领域TOP1%的高被引论文 分22个学科,按被引频次的高低排出TOP1%科学家、TOP1%研究机构、TOP50%国家、TOP50%期刊 按一定的方法分析出各领域TOP1%的高被引论文 给出各领域各年论文的平均被引频次 给出各领域的研究前沿
例:环境/生态学领域top1%科学家
例:环境/生态学领域top1%科学家
例:环境/生态学领域top1%科学家 还可以按论文量排序
例:环境/生态学领域top1%研究机构
例:环境/生态学领域top1%研究机构
例:环境/生态学领域top50%国家(地区)
例:环境/生态学领域top50%国家(地区)
例:环境/生态学领域top50%期刊
例:检索生物多样性研究领域的研究前沿
检索生物多样性领域的高被引论文
检索生物多样性领域的热门论文
了解各领域或某个领域论文篇均被引频次
了解各领域或某个领域高被引论文的统计域值
了解各领域论文总量及总被引频次
其他产品:SPECIAL TOPIC
其他产品:IN-CITES
其他产品:SCIENCE WATCH
其他产品:JOURNAL CITATION REPORTS 利用JCR了解学术期刊的重要性 某个学科领域中,哪些期刊在学科领域中影响力最大? 哪些期刊是被学者们经常利用和引用的? 哪些期刊是热门期刊? 帮助科研人员选择、确定最适合自己发表论文的期刊,对已经发表了的论文,则可以查询该论文所发表期刊的最新状态,并且利用 JCR 可以找到与自己研究领域相关的一系列期刊。 可以为图书馆的选刊工作提供依据,并可以为每种刊存放多久后即可归档,提供一个合适的时间参考
ISI Journal Citation Reports 内容分为两个版本 JCR Science Edition- 提供SCIE中所收录的科学技术中170多个领域6100多种国际领先的科学技术领域期刊的引文分析信息。 JCR Social Sciences Edition-提供SSCI中所收录的社会科学54个学科领域1800多种期刊的引文分析信息。 JCR 对每种被收录的期刊,都会提供以下的统计数据: 引文和论文数量;影响因子;立即影响指数;被引半衰期;引用半衰期;源数据列表;引用期刊列表;被引期刊列表;主题分类;出版社信息;期刊标题变化
统一登录网址 http://www.isiknowledge.com 统一登录网址 http://www.isiknowledge.com 选择登录JCR
选择版本 选择检索入口: 1.流览一组期刊:按主题分类、出版国家、出版机构 2.检索特定期刊:按期刊全名、缩写名、刊名关键词、ISSN号 3.流览全部期刊 选择版本 选择完入口后提交Submit
JCR每年更新一次,大概在每年的8月份左右更新,目前最新版本是2005版
选择期刊排列的顺序:分别按字顺、影响因子、立即影响指数、被引半衰期、总引文数等排序 按学科检索: 选择一个或多个学科 选择期刊排列的顺序:分别按字顺、影响因子、立即影响指数、被引半衰期、总引文数等排序 提交Submit
按出版机构检索: 选择一个,或多个出版机构 选择期刊排列的顺序:分别按字顺、影响因子、立即影响指数、被引半衰期、总引文数等排序 提交Submit
按出版国家检索: 选择一个,或多个国家 选择期刊排列的顺序:分别按字顺、影响因子、立即影响指数、被引半衰期、总引文数等排序 提交Submit
对期刊列表进行重新排序:按期刊名称、总被引频次、即时指数、影响因子进行排序
Derwent data analyzer软件功能介绍 Derwent analytics是一个知识挖掘和可视化的分析工具,它是thomson derwent公司与Search Technology, Inc合作的产品。Derwent analytics软件是以由美国国防部高级研究计划局、陆军坦克机动车辆局、美国陆军航空和导弹司令部资助的研究项目(美国政府项目"Technology Opportunities Analysis System( DAAH01-96-C-R169))工作的为基础的。
Derwent data analyzer软件功能介绍 据了解,此项目中北京理工大学管理与经济学院“知识发现与数据分析”实验室参与了这个研究项目的工作。北京理工大学管理与经济学院在国内率先开展基于数据挖掘和知识发现的高技术监测、评估、预测理论方法和技术研究,对技术机会选择、高技术评估和高技术创新管理引入了新的理论、方法和技术手段,开拓了新的研究领域。他们与美国有关单位三年多来的合作研究,本项目申请负责人曾参加美国国家科学基金在研项目"Mining Bibliographic Information on Emerging Technologies"和美国政府项目"Technology Opportunities Analysis System( DAAH01-96-C-R169)"的研究工作,对国外两个新兴技术领域Data Mining 和Information Extraction在科技文献数据库的应用进行了开创性研究, 并利用美方INSPECT及EI数据库及美国专利数据库(PATS)开展技术机会分析,对两个技术前沿领域 "计算语言技术"(Computational Linguistics)和自然语言分析技术(Natural Language Processing)进行了较系统的技术预测和评价。
Derwent data analyzer软件功能介绍 特点: 能自动汇总输入的数据,按照不同的侧面分类快速显示所汇总的数据,初步给用户一个发展趋势的概况。 利用一些简单的分析工具,用户可以: 数据整理(Cleaned lists)– 数据分析的结果首先取决于数据的准确性与完整性:例如将已经合并的两家专利申请企业的专利清理、组合成一家合并后企业的总专利清单 共现矩阵(Co-occurrence matrices)– 将两种不同类型的数据生成比较矩阵,借此发现两种不同类型数据间内在的相互关系。例如将专利权属人(一般是公司)与专利发明人之间生成关系矩阵,了解同一个专利发明人是否曾经为多家公司做过专利发明。 数据图谱(Maps)– 将大量的数据汇总进行各种分析(如聚类分析、趋势分析等)并以二维和三维的方式图示的形式表示出来
Derwent data analyzer软件功能介绍 Derwent Analytics除了以上的一些简单的分析工具外,还具有更加复杂的分析功能,这些复杂的分析功能是通过预置在软件中的多个分析模块完成的: 预置的分析模块(宏)——单击不同的分析模块,即可按照模块预定的分析功能自动分析所导入的数据,并最终生成分析报告 工具包——用户可以利用工具包建立用户自己定义的词典等
Derwent data analyzer软件功能介绍 由于Derwent专利数据库中的记录是经过专家深度标引,标准化处理过的专利数据,结合Derwent Analytics对这些标准化处理数据的分析,信息专业人士和其它用户可以透过这些分析数据: 洞察技术发展趋势 掌握竞争对手的专利发展情况 跟踪特定技术领域内的发展趋势 找出多产的专利发明人及其供职的公司 确定研究战略和发展方向
示例:Stem Cell ・目的 干细胞相关研究及发展动向 ・检索式 Topic: Stem Cell* 数据库 干细胞相关研究及发展动向 ・检索式 Topic: Stem Cell* 数据库 Derwent Innovations Index
示例: Stem Cell ~时间推移~ 优先权主张年 专利公布年
各年新专利公布分布: 基本专利公布年 示例: T H O M S O N S C I E N T I F I C Macro 2 # of priority countries
T H O M S O N S C I E N T I F I C 示例: 专利权属人专利申请分布
T H O M S O N S C I E N T I F I C 示例: 专利权属人专利种类分布
专利研究内容的变化 (基于自然语言分析功能) T H O M S O N S C I E N T I F I C 示例: 专利研究内容的变化 (基于自然语言分析功能)
示例 专利申请与发明人之间的关系
这一领域的“玩家”和专利活动:时间分布 一次点击分析研究领域中申请专利的分布 One click functionality to automatically generate a number of charts and graphs within Derwent Analytics.
对于这个公司来说那一个研究领域是最重要的? Patent Assignees (Cleaned) Inventors (Cleaned) First Priority Years Basic Patent Year Derwent Classifications (Cleaned) Manual Codes CPI Top 20 Top Items to Last Family Member Years % in last 3 years Unique Terms new in last 3 years EXXONMOBIL RES & ENG CO [102] WITTENBRINK, R J [15]; RILEY, K L [14]; ELLIS, E S [13]; GUPTA, R [11]; SOLED, S L [11] 1990 - 2003 59% of 102 E12-Organometallics - ie containing other than H, C, N, O, S, halogens, Si and P [2] A97-Miscellaneous goods not specified elsewhere - including papermaking, gramophone records, detergents, food and oil well applications [2]; J01-Separation - including evaporation, crystallisation, solvent extraction, chromatography, dialysis, osmosis including drying gases and/or vapours, and separation of solids from gases, liquids and other solids. Isotope separation, filter materials (including molecular sieves for separation), and centrifuges (except where used for analysis [2] H04-F02A [68]; H04-A07 [42]; H04-A01 [36]; H04-F02E [34]; N03-D02 [26] INST FRANCAIS DU PETROLE [58] KASZTELAN, S [16]; BENAZZI, E [15]; MARCHAL-GEORGE, N [12]; MOREL, F [7]; DIDILLON, B [6] 60% of 58 None H02-Unit operations - including distillation, sorption and solvent extraction [2] H04-F02E [26]; H04-E08 [21]; H04-F02A [21]; H04-A07 [16]; H04-A01 [14] 谁是最顶尖的公司和发明人? 对于这个公司来说那一个研究领域是最重要的? 在这个领域申请专利有多长时间? 这些公司在做哪些新的研究课题? Automated analyses to profile Top patent assignees or any other user defined group of patent assignees with one click. Value add statistics tell: How long a patent assignee has been actively patenting in a technology area Top inventors Current research focus as % of new patents published within the last 3 years Primary technology areas and unique technology areas by Derwent Class Advantages of Derwent Value add data and DANA: Value add Derwent Classes add standardized classification of technology areas Derwent Manual Codes give specific details of technology area
发现研究领域间的关系 指定项目的细节和发展趋势 在指定技术领域内的所有记录 List View: Tabular format of all items in a particular field across all of the records in the imported set. Easy way to sort, group, and search data Drill down to original Derwent Titles Select specific titles for each patent assignee using added criteria in the detailed views windows Advantages of Derwent Data in DANA: PACO and Cleanup: Cleanup lists of patent assignees using Derwent Patent Assignee Codes to view all patents for entire corporate entity. Derwent Classifications Thesauri- Quickly identify technology areas using Derwent Class with the definition of Technology area next to it 在指定技术领域内的所有记录
Instit Francais du Petrole Catalytic Distillation Tech. 分析机构内或之间发明人的小组 Catalytic Distillation Tech. Exxon Mobil Maps: Visually cluster based on statistical similarity All maps have similar layout Quickly identify top inventor teams within an organization and company collaborations
这个发明人在Exxon 和 Akzo Nobel都申请专利 Maps: Visually cluster based on statistical similarity All maps have similar layout Quickly identify top inventor teams within an organization and company collaborations Drill down to original Derwent records 下拉以研究和批注 Derwent 记录
报告结束! 谢谢!