2014《中国学术期刊国际、 国内引证报告》研制报告 各位领导、各位代表,下午好! 下面由我来介绍《中国学术期刊影响因子年报》和《中国学术期刊国际引证年报》的研制目的、方法和结果。 中国科学文献计量评价研究中心 中国学术文献国际评价研究中心 伍军红
提纲 ●期刊评价的目的 ●国际影响力评价的必要性 ●期刊影响力评价方法 ●两个报告的研制过程 ●结果及应用 这是我今天报告的主要内容。 首先,我介绍这两个报告的背景与目的。
1. 期刊评价的目的 “期刊品牌”是期刊生存、发展的基本条件 包含了定性含义的定量评价“指标集”准确地代 表了期刊品牌 优质稿源 + 市场 包含了定性含义的定量评价“指标集”准确地代 表了期刊品牌 期刊评价为期刊管理提供真实可靠的参考依据 学术期刊出版资源的配置、管理 在大数据和自媒体时代,直接发表、免费浏览比比皆是,学术期刊以何生存呢?我们认为学术期刊能够生存主要靠的是 “学术品牌”。 “学术品牌”是因期刊对学术交流活动提供的服务或内容的品质,形成无形的定位,形成了在学者心中的形象,是软实力的重要标志。学术期刊是一个“汇编作品集”。因此品牌对期刊的生存和发展尤其重要。是其获取优质稿源和读者市场的根本保障。 有人说树品牌主要靠评优、评奖。但现在各种评优评奖让人眼花缭乱,很多评的并非学术品牌。我们认为,在信息社会,期刊数量大增的情况下,只有依靠大数据分析对所有期刊进行科学客观的评价,才能全面揭示期刊的学术品牌力。 用包含了定性含义的定量评价“指标集”来代表期刊品牌,对期刊管理部门也非常重要。“科学决策需要大数据支持”已经成为社会共识。在我国现行出版管理体制下,学术期刊出版资源的配置、管理都迫切需要全面、客观、公正的评价数据为参考依据。 3
2. 期刊国际影响力评价的必要性 当前期刊面临的主要问题是国际竞争 我国期刊国际影响力评价为科研管理提供依据 抢夺优质稿源,抢占订阅市场;不利信息安全;冲击出版业发展 我国的学术期刊,特别是科技期刊,面临的主要问题是国际出版品牌对本土学术出版的竞争——从直接抢夺中国的优质稿源到抢占期刊的订阅市场。根据SCI数据库统计,我国的学者在国际期刊上发表科技论文从2008年的11.4万篇大幅增长到2013年的23.2万篇。我国本土科技期刊3569种在2013年发表文献102.7万篇,也就是说我国学者的论文1/5流向海外。社科也一样,SSCI论文从2008年的4430篇到2013年的9722篇,5年间也增长了1倍。 学术机构普遍有这样的规定:以在一定级别的期刊上发表文章作为学术交流和成果评价的手段。这有一定的合理性,但关键在于这条线应该怎么划。 过去各种国内期刊评价都未引入国际期刊的数据,因此没有触及与国际学术期刊的竞争问题。我国期刊国际影响力评价的缺失,使科研管理部门没有依据,只能以SCI作为标准。这种标准对中国期刊特别是中文期刊是极不公平的。我们应该通过大数据分析,综合考虑国内、国际两个市场,重新划定一条科学合理的线。 我国期刊国际影响力评价为科研管理提供依据 科研管理、人才管理、项目管理 4
3. 评价内容及方法 影响力是质量的某种反映,虽不能等同于质量,但其根本上仍由质量决定。 3.1本报告评价什么? 学术期刊质量的定义:符合或超越读者期待的产品及服务。学术期刊的质量是其出版水平的综合体现,表现为内容上的先进性、重要性、创新性、科学性和出版的规范性、及时性、可传播性等。 学术期刊的影响力的定义:是指学术期刊所传播的学术观点、思想、理念、理论、方法、发现、发明、事实、情感等内容,以及期刊的品牌,引发其受众关注和思考,取得其认同,甚至改变其思维、观点和行为的能力。 学术期刊质量的定义:符合或超越读者期待的产品及服务。学术期刊的质量是其出版水平的综合体现,表现为内容上的先进性、重要性、创新性、科学性和出版的规范性、及时性、可传播性等。 学术期刊的影响力,是指学术期刊所传播的学术观点、思想、理念、理论、方法、发现、发明、事实、情感等内容,以及期刊的品牌,引发其受众关注和思考,取得其认同,甚至改变其思维、观点和行为的能力,体现为其对学术发展产生作用的大小,反映了学术界对期刊及其所报道内容的重视程度。 影响力是质量的某种反映,虽不能等同于质量,但其根本上仍由质量决定。影响力是时间的函数,高质量的论文一般会随着时间的检验,慢慢凸现其影响力。期刊的传播效果,可以通过调查刊物被大量国内、外学术文献引证的情况做出科学、合理的宏观分析判断。 影响力是质量的某种反映,虽不能等同于质量,但其根本上仍由质量决定。 5
3. 评价内容及方法 3.2 指标体系 基于引文统计的主要的指标体系包括: (1)引用频次统计: 在某一统计年内,期刊的总被引频次。具体还可以分为:历史各年度发表文献的被引频次、期刊之间的互引频次等。 (2)发表文献数量统计: 如载文量、基金论文比等。 (3)计算出来的评价指标: 表达篇均被引频次概念的:影响因子、即年指标、5年影响因子等。表达期刊互引情况的指标:引用期刊数、被引期刊数、他引比等。与文献生命周期有关的指标:引用半衰期、被引半衰期等。 有学者提出还应考虑下载、网络评论等数据,但下载行为很复杂,包括了爬虫采集数据、学生学习、情报服务等等,并不单纯是学者研究所使用。而网络评论无法判断评论是否科学严谨。只有引用,是受学术规范约束的行为,每个作者都被要求必须对使用过的文献表达知识产权的尊重,否则就是抄袭和剽窃行为。 因此引文统计分析是可靠的、可计量的。 基于引文统计的主要的指标体系包括: (1)引用频次统计: 在某一统计年内,期刊的总被引频次。具体还可以分为:历史各年度发表文献的被引频次、期刊之间的互引频次等。 (2)发表文献数量统计:如载文量、基金论文比等。 (3)计算出来的评价指标:表达篇均被引频次概念的:影响因子、即年指标、5年影响因子等。表达期刊互引情况的指标:引用期刊数、被引期刊数、他引比等。与文献生命周期有关的指标:引用半衰期、被引半衰期等。
3. 评价内容及方法 3.3国内引证报告统计源 国内期刊 1. 引文著录很少或著录很不规范的期刊。 2 .刊登严重疑似学术不端文献数量较多或比例较高的期刊。 3 .刊登低水平重复文献较多的期刊,采用学科内末尾淘汰法遴选。 4 .过度自引或明显“同盟”互引的期刊。 5 .非原创或非学术类期刊。 国内会议 论文 引文统计源非常重要,直接影响到评价结果的科学性、客观性、全面性。统计源文献应根据评价目的来合理选择。我们的评价目的是评“学术影响力”,就应该将能够反映期刊学术影响力的、有知识创新的文献尽量全面地纳入。而那些不能反映“学术影响力”的文献则应该尽量排除。 不应做统计源的文献包括:知识的传播推广类文献,如科普、学科教学等。学术泡沫类文献,如抄袭和重复发表文献、低水平重复研究等。而且,我们将统计源文献扩大到了博硕士论文和会议论文。 1. 下载频次为0的论文。 2 . 严重疑似学术不端文献。 3 .与期刊重复发表的文献。 国内博硕士学位论文
3. 评价内容及方法 并从中排除16.6万条抄袭文献的引文和被引,约占 总引文的3%,占影响因子值的3%。 3.3国内引证报告统计源 国内最终确定4918种来源期刊,其中科技期刊3282种,人文社 科期刊1658种。引文488.2万条。 博士学位论文2.3万篇,硕士学位论文30.3万篇。引文620.8万 条。 会议论文5.2万篇,引文23.0万条 今年的国内报告,最终确定4918种来源期刊,其中科技期刊3282种,人文社科期刊1658种。博士学位论文2.3万篇,硕士学位论文30.3万篇,会议论文5.2万篇。并排除16.6万条抄袭文献的引文和被引,约占总引文的3%。 并从中排除16.6万条抄袭文献的引文和被引,约占 总引文的3%,占影响因子值的3%。 8
3. 评价内容及方法 3.4 国际引证报告统计源 SSCI、A&HCI期刊 4505种 《国际引证报告》的统计源 SCI期刊 8621种 3.4 国际引证报告统计源 社科期刊统计源6429种 科技期刊统计源 8621种 SSCI、A&HCI期刊 4505种 《国际引证报告》的统计源 SCI期刊 8621种 国际知名数据库非WOS社科1483种 《国际引证报告》的统计源也应按评价“国际影响力”的标准遴选来源期刊。除了欧美发达国家的期刊外,还应纳入其他国家和地区的代表性期刊。来源刊名单的确定还要广泛征求国内外专家的意见,需要一步步来。 目前,著名的WOS数据库收了欧美最有代表性的期刊,可以在一定程度上反映我国期刊的国际影响力。今年我们评科技期刊仍主要采用SCI数据库为统计源,含科技期刊8621种。 评价人文社科期刊仅采用SSCI、A&HCI的4505种期刊是不够的。为了更全面地统计我国社会科学期刊的国际影响力,补充了国际知名数据库:Elsevier,Springer,Wiley,Emerald,等国际领先的大型出版集团的非WOS社科期刊为来源刊1483种。并在专家的推荐下,增加了关注中国的小语种期刊441种,这些期刊由于是小语种,因此没有被世界各大数据库商收录,但却是我国社科专家研究工作中不可或缺的重要期刊。 关注中国问题的小语种期刊441种 9
3. 评价内容及方法 3.5数据标准 (1) 中国7000余种期刊中英文刊名规范文档数据库 (2) 中国学术期刊题录数据库,收录国内学术期刊约8000种,文献总量4200多万篇。 用于引文链接。 (3) 按《载文量统计规范》统计了近6年期刊的载文量、可被引文献量。 (4) 引文数据质量要求达到正确率99.7%、完整率99.7%。 为了保证统计数据和期刊排名的准确性,我们建立了各项数据处理标准、处理流程和质量要求,并按此标准对原始数据进行了规范化和标准化,建立了系列数据库。包括: (1) 中国7000余种期刊中英文刊名规范文档数据库 (2) 中国学术期刊题录数据库,收录国内学术期刊约8000种,文献总量4200多万篇。 用于引文链接。 (3) 按《载文量统计规范》统计了近6年期刊的载文量、可被引文献量。 (4) 引文数据质量要求达到正确率99.7%、完整率99.7%。
4.两个报告的研制过程 经过上述全流程的严格控制,保证了数据完整,全面,准确性。 制定标准 采集数据 数据规范加工 完整率、正确率检测 试算、验证、个别核查 在标准的指导下, (1)采集数据:包括在WOS数据库中检索数据。加工补充期刊数据。 (2)数据规范加工:采用了引文链接、刊名模糊匹配等计算机自动处理技术,配合人工检查,提高了数据处理效率和正确率。 (3)检测:逐本核查完整率,抽查正确率,确保数据达到质量标准。每年经过专家组鉴定。 (4)试算、验证、个别核查:指标的计算经过多人复核,对指标年际变化大的期刊重点复查。 经过上述全流程的严格控制,保证了数据完整,全面,准确性。 11
5. 研制结果 1、基本数据 发布在中国知网- 评价中心- “个刊影响力统计分析数据库” 《影响因子年报》和《国际引证报告》提供了我国5500多种学术期刊的评价数据集。这是我们的国内影响因子年报,就是大家拿在手里的书和光盘。这些数据都将发布在中国知网的“个刊影响力统计分析数据库”中。
五-1 影响因子年报——学科排序 在网上的呈现形式就是这样的,以图表的形式呈现。
6.品牌期刊的遴选 国际影响力指数CI是一个综合指标。由影响因子和 被引频次合成。 影响因子的意义、总被引频次的意义 6.1 国际影响力指数CI(Clout Index)说明——(1)选择双指标的理由 国际影响力指数CI是一个综合指标。由影响因子和 被引频次合成。 影响因子的意义、总被引频次的意义 期刊 总被引频次 办刊历史 发文量 我们遴选TOP品牌期刊主要用了一个综合指标CI(Clout Index),下面我对该指标做一个详细说明。 国际影响力指数CI是由影响因子和被引频次合成。 影响因子目前被公认为代表期刊办刊质量。但只用这一个指标是不够的。首先,根据定义,影响因子反映的是期刊近2年出版工作的成效。期刊被引半衰期达到4~12年,2年只是通常情况下的被引高峰期,实际在总被引频次中只占约20%。第二,影响因子与期刊的历史、规模等因素无关,一定程度上反映了所载选题的热门程度。只用影响因子单一指标,就会导向期刊发表大量符合当前热点但不解决根本性问题的论文;导向人为限制接收论文的数量,这样就失去了期刊作为学术交流平台的基本功能。另外,影响因子是一个很容易操作的指标,通过自引、同盟互引等手段很容易提高。 总被引频次与期刊的办刊历史、发表论文规模等直接相关。总被引频次反映总的影响力,包括了影响因子统计范围以外的80%的被引频次。但只考虑总被引频次单一评价指标也是不行的。这会助长盲目扩大论文数量而不顾学术质量的风气。 基于上述认识,我们综合考虑影响因子和总被引频次,定义了综合指标——CI。为了公平起见,考虑到我国大部分期刊均未被WOS数据库收录,在计算“国际影响力指数CI”时,采用他引总被引频次、他引影响因子来替代。 学术质量 文献层次 与类型 14
6.品牌期刊的遴选 6.1 国际影响力指数CI说明——(2)标准化方法 6.1 国际影响力指数CI说明——(3)指标合并方法 式(1)中yi为标准化值,Xi为的原值,Xmax为最大值,Xmin为最小值。经标 准化后,他引总被引频次或他引影响因子的值均在[0,1]之间。 6.1 国际影响力指数CI说明——(3)指标合并方法 首先,我们对他引总被引频次和他引影响因子采用线性归一法进行标准化,公式为。。。,经标准化后,他引总被引频次或他引影响因子的值均在[0,1]之间: 然后进行向量综合,公式为。。。 15
用图解来表示,就是:我们以x轴表示标准化的国际他引影响因子,以y轴表示标准化的国际他引总被引频次,每个期刊在这个坐标系中都可以用一个散点来表示。原点(0,0)代表影响因子和总被引频次均为0。(1,1)点代表影响因子和总被引频次都达到最高值。以(1,1)点为圆心,画圆,弧线上的点表示国际影响力指数大小相等的期刊。圆弧左下方的期刊是CI值小的期刊,圆弧右上方的期刊是CI值大的期刊。 16
6.品牌期刊的遴选 6.1 国际影响力指数CI说明——(4)向量求和法与线性求和法的比较 我们认为影响因子和总被引频次是同等重要的评价指标。如果采用线性相加法,就是CI=A+B,如图中直线所示,与上述“向量相加”的区别在于越靠近两条坐标轴的点,向量和的值越比线性和的值低。如图中红色区域所示。也就是说,影响因子或者总被引频次单一指标高而另一指标低的期刊,用向量法里可以更好地被淘汰,这种算法更符合“既要追求质,又要追求量”的评价理念。 17
6.品牌期刊的遴选 6.2 TOP期刊遴选中的几个问题的考虑 6.3 top名单遴选过程和结果 (1)是否分学科 (2)是否国内国际综合考虑 (1)科技、社科期刊分别按CI由大到小排序,遴选出前TOP5%、TOP5%~TOP10%。 (2)专家审核 (1)分学科 由于传播的原因,我国各学科期刊的国际影响力水平和“走出去”程度均存在较大的不平衡。按学科遴选Top期刊,势必会使得那些较强学科的好的期刊落选,取而代之的是弱势学科中国际影响力不怎么强的期刊进入榜单,这样不利于品牌评价。随着时间的变化,各学科在海外影响力的提高和均衡发展,我国将来就可以做分学科排名了。 (2)国内国际综合考虑 国际影响力评价理应综合考虑国内、国际影响力的总和。但首先,分开评价更有助于清楚地了解期刊在两个市场的情况。其次,对于如何合并这两个报告还没有一个公认的方法。主要的困难在于对“国内的引用是否与国际的引用等价”这个问题的认识不统一。 6.3 top名单遴选过程和结果(1分,193字) 为了彰显期刊品牌,我们今年继续评选 “中国最具国际影响力学术期刊”“中国国际影响力优秀学术期刊”。对科技、社科期刊分别按CI由大到小排序,遴选出前TOP5%、TOP5%~TOP10%。然后将遴选方法、指标、初选名单送给70多位专家评审,根据专家意见删减了个别期刊,按CI值依序补充,保持入选期刊数量不变。最终确定了“最具”“优秀”各235名期刊名单。470种TOP10期刊中457种为国内各机构评选的核心刊,另13种多数为英文刊、新创期刊。
7.总结与展望 (1)国际报告已经是连续发布的第3年,得到了期 刊主管部门、期刊编辑部、学术界的普遍认可,鼓励 我们将这一工作连续不断地进行下去。 (2)随着数据积累,分析年际间数据变化规律可以 得出很多有意义的结论,欢迎大家使用我们的数据。 (3)评价方法仍需继续改进,包括国际统计源期刊 的遴选标准、CI指标的改进、国内国际综合方法等 仍需继续研究。 (1)国际报告已经是连续发布的第3年,得到了期刊主管部门、期刊编辑部、学术界的普遍认可,鼓励我们将这一工作连续不断地进行下去。 (2)随着数据积累,分析年际间数据变化规律可以得出很多有意义的结论,欢迎大家使用我们的数据。 (3)评价方法仍需继续改进,包括国际统计源期刊的遴选标准、CI指标的改进、国内国际综合方法等。 19
谢谢!祝新年快乐! 网 址:http://www.cnki.net 电 话:010-82895056-8598 网 址:http://www.cnki.net 电 话:010-82895056-8598 Email:aspt@cnki.net 邮 编: 100192 地 址:北京市海淀区西小口路66号东升科技园A2楼 我的报告结束了,欢迎大家批评指正。并祝各位领导、各位代表新年快乐!万事如意!