人文社科领域的 文献计量学研究 Библиометрические исследования в области социальных и гуманитарных наук Доклад в ИНИОН РАН. Москва, 21 мая 2013 г. 蒋颖 中国社会科学院图书馆 Цзян Ин, зам. директора Центра документации и информации Китайской академии общественных наук
主要内容 一、文献计量学的发展 二、人文社科领域文献计量学研究的特点 三、热点问题 四、发展趋势及挑战 2
一、文献计量学的发展 1922 年,休姆( E. W. Hulme )提出 “ 统计书目学 ” ( Statistical Bibliography )一词,认为它是通过简单的文献计数并用常规统 计方法揭示人类文明进程的定量研究手段。 1969 年,普理查德( A. Pritchard )提出用 “ 文献计量学 ” ( Bibliometrics )这个概念来代替 “ 统计书目学 ” 一词,这个术语 一经提出,就得到了图书馆学情报学领域的普遍认可。 此后,又陆续出现了 “ 情报计量学 ” ( Informetrics )、 “ 信息计量 学 ” ( Informetrics )、 “ 科学计量学 ” ( Scientometrics )、 “ 网络 计量学 ” ( Webometrics )。 3
普赖斯的工作 普赖斯出生于英国,长期任美国耶鲁大学科学史 与医学史系教授,他发现了文献的指数增长律与 逻辑增长律、普赖斯定律等,并提出普赖斯指数 和最大引文年限的概念。其著作《巴比伦以来的 科学》、《小科学、大科学》影响深远。 普赖斯所取得的成就促进了科学计量学的诞生。 1983 年,普赖斯去世。为了纪念他的卓越贡献, 人们设立了普赖斯奖 —— 文献计量学领域的最高 奖项。 4
Derek de Solla Price Awards 5
引文索引的诞生 年,尤金 · 加菲尔德在《科学》杂志 上发表了《科学引文索引》( Citation Index for Science )一文,提出了建设 引文索引的构想。 1963 年, ISI 出版了检索型期刊 Science Citation Index ,简称 SCI , 1973 年和 1978 年,出版 SSCI 和 A&HCI 。
1969 年世界上第 1 本科学计量学专著问世,是由 前苏联学者纳利莫夫 (V.V.Nalimov, ) 和 穆利钦科 (Z.M.Mulchenko) 合著的《科学计量学: 把科学作为情报过程来研究科学的发展》。俄语 的术语 “ 科学计量学 ” 正式被创造出来。同年也有 了英语的 “Scientometrics” 。这标志着科学计量学 奠基期基本完成,从此跨入发展时期。 1978 年国际《科学计量学》杂志的创刊号在匈牙 利出版。纳利莫夫是创建者之一。 7
Vasily V. Nalimov ( ) Vasily V. Nalimov was a Russian polymath and visionary. In 1969, he published jointly with Z. M. Mulchenko their pioneering book entitled (Scientometrics) in which they coined the term Scientometrics which is nowadays used synonymously for bibliometrics and which is also the title of the international core journal of our field. 8
中国的文献计量学研究 大体上可划分为三个阶段:第一阶段是 年的文 献计量学初创阶段,第二阶段是 年的文献计量 学初级发展阶段,第三阶段是 1986 年以后的文献计量学持 续发展阶段。 早期的研究者主要来自于科学学和情报学界 中文人文社科引文数据库的建设 核心期刊与学术评价研究 9
人文社科领域文献计量学研究 的特殊性 自然科学:国际化、文献集中、英语是通用的学术语言、 期刊是主要的文献类型、老化速度快 人文社科:区域化、文献离散、语言的多样化、图书、期 刊都是重要的文献类型,有些人文学科,使用率最高的文 献类型是图书、老化速度慢 因而: 数据问题:传统的引文索引( SSCI 、 A&HCI )覆盖面不 够(扩大覆盖面、建立图书引文索引和本地引文索引) 方法问题:引文方法不一定适合所有学科(内容分析) 特殊情况的处理:数据的时间跨度要长,经典文献的处理
二、人文社科领域 文献计量学研究的特点 1. 技术驱动和评价驱动 2. 用于学术评价的争议 3. 基础问题有待解决 4. 不断开发新指标 11
三、热点问题 1. 数据源的开发与研究 2. 学术评价研究 3. 核心期刊研究 4. 网络计量学的发展 5. 可视化技术的研究和应用 6. 面向学科的文献计量学分析 12
1. 数据源的开发与研究 文献计量学是 “ 数据密集型 ” 学科,数据是研究的基础。 传统的引文索引 ——SSCI 、 A&HCI 、 CSSCI 、 CHSSCD 、 ERIH 文摘数据库发展而来的引文库 ——Scopus 、 CNKI-CCD 文摘 / 全文数据库 —— 剑桥科学文摘系列 搜索引擎 ——GoogleScholar 、 Altavista 自动引文标引的系统 ——CiteSeer 、 RePEc 、 Citebase 等等 图书馆的书目数据库、图书馆流通数据、电子资源的使 用统计、搜索引擎的检索日志等 …… 13
2. 学术评价研究 早在上世纪 20 年代前后,人们就开始利用出版物和引文来 评价科学活动。 目前,部分国家在评价体系中采用了文献计量学指标,而 另外一些国家的评价方法仍以同行评议为主,总体看来文 献计量学只适用于部分学科,或用于参考。同行评议仍然 是国际上多数国家进行人文社科评价的最主要方法。 在实际的科研活动中,文献计量学的相关指标还是直接或 间接渗透到单位对科研人员的聘用、升职等很多方面。 14
学者的共识 人文社会科学文献的分布和利用规律不同于自然科学。仅仅利用以 英文期刊为基础的引文数据不能全面揭示全球人文社会科学的特点。 社会科学领域的一些学科(如经济学、社会学等)比较适宜于利用 引文数据进行学术评价,而以图书为主的人文领域则不太适合利用 目前的引文数据库来评价。 可以在宏观层面进行绩效评估和比较,但是对于微观层面则要慎用。 分析的基础数据除了引文数据库之外,还要充分依靠其他一些可以 进行定量分析的数据源。 避免只使用文献计量学指标或仅仅使用单一的文献计量学指标进行 评估。 15
3. 核心期刊研究 核心期刊的概念源于布拉德福对期刊的分区 近期则更多地进行核心期刊的遴选实践,以 及各种评价和测度指标的开发。 布拉德福定律: “ 如果将科技期刊 按期刊在某专业论文的数量多寡, 以递减顺序排列,则可分出一个 核心区和相继的几个区域,每区 刊载的论文量相等,此时核心区 期刊和相继区域期刊数量成 1:n:n 2 …… 的关系。 ” 16
中国的核心期刊评价 中国大陆 北京大学《中文核心期刊要目总览》 中国社会科学院文献信息中心的《中国人文社会科学核心期刊 要览》 南京大学的 CSSCI 来源期刊及《中国人文社会科学期刊学术影 响力报告》 武汉大学的《中国学术期刊评价研究报告 ——RCCSE 权威期刊 和核心期刊排行榜》 中国科学技术信息研究所的《中国期刊引证报告(扩刊版)》 清华大学中国学术期刊(光盘版)电子杂志社的系列期刊报告 台湾地区 台湾社会科学引文索引( TSSCI )的来源期刊 台湾人文学引文索引核心期刊( THCI Core ) 17
4. 网络计量学的发展 链接分析 —— 包括与传统引文分析相似的超链接解析和应 用计算机理论和图论理论进行的万维网拓扑结构研究。 网络链接的动机和行为 —— 同引文链接相比,网络链接的 情况更加复杂,有更多的不确定性,引用类型更加松散和 多样化,各学科有不同的链接特点和习惯,链接数量不能 直接反应机构的学术水平。 描述万维网结构 —— 研究网络信息资源的分布、增长、老 化规律。网络空间中指数定律、文献计量学的三大定律、 应用社会网络理论来测度网页的位置和距离。 网络信息资源评价 —— 定性评价和定量评价两种方法。定 量评价的主要方法是链接分析方法。 网络引文研究 —— 针对学术领域中的网络正式出版物和灰 色文献开展范围更广的引文研究。 18
5. 可视化技术的研究和应用 数据可视化( Data Visualization )技术指的是运 用计算机图形学和图像处理技术,将数据换为图 形或图像在屏幕上显示出来,并进行交互处理的 理论、方法和技术。 科学数据的可视化:反映的是物体固有、但人眼 看不见的结构,如医学中的诊断技术 CT 、 MRI 和 正电子放射断层扫描( PET )等等; 信息的可视化:非空间数据的可视化,这些对象 是没有固有结构的,如数据库中文献之间的语义 关系。
描述事物的总体结构和特征,避免盲人摸象
可视化方法的应用 用图形方式对数据进行表现在文献计量学研究领域开始得 较早。 1964 , Garfield—— 引文编年图 1974 , Griffith 和 Small 利用同被引技术绘制学科专业结构 图 …… 进入 21 世纪,随着数字化的发展和可视化工具的开发,可 视化技术的应用达到了更高的水平:可视化方法、图像的表 现方法、工具软件等方面。
Garfield 的引文编年图 由 Asimov 博士在《遗传密码》一书 中确定的 DNA 理论发展和被证实的 网络图 通过引文确定的 DNA 理论发展和 验证的网络图
Small 和 Griffith 的科学结构图 1972 年核物理文献簇框图
Callon 的学科战略图 1995 - 99 年文献计量学战略坐标图 2000 - 04 年文献计量学战略坐标图
Chaomei Chen 等的作者共引图
Leydesdorff 的期刊引用关系图
SOM Map
ET-map
VxInsight 引文图
6. 面向学科的文献计量学分析 分析实例 : “ 中国问题研究 ” 的文献计量学分析 1978 年以来,随着中国改革开放的不断深入, 中国经济的快速增长越来越引起了国际社会 的关注 数据来源: 1996 年至 2010 年 SSCI 有关中国 的数据 30
逐步升温的中国问题研究 年中国问题研究国际期刊发文量
谁在关注中国? 发文量分布 发文量分布
研究领域的变化趋势
国家之间的合作
中国问题研究的总体状况 中国研究文献经历了一个快速的增长过程, 参与的国家和地区越来越多 中国的角色发生了很大变化 中、美是核心 中国与其他国家的合作不断增强 经济、社会和环境是重点研究领域,国际 关系、政治学发文量排名不断下降
四、发展趋势和挑战 1. 数据源的拓展和整合 2. 技术和方法的发展 3. 文献计量学应用越来越普遍, 研究领域不断拓展 4. 文献计量学也将迎来更大的挑战 36
谢谢! 37