Download presentation
Presentation is loading. Please wait.
Published by釜 甄 Modified 7年之前
1
E-mail: zhoucheng@pku.edu.cn
科学的计量研究 北京大学科学与社会研究中心 周 程 Tel&Fax: (o)
2
科学的计量研究 一、科学计量学的产生与发展 二、科技文献计量研究成果简介 1.萌发时期 2.奠基时期 3.发展时期 1.引文分析
2.学术评价 3.SCI论文的统计分析
3
引言 马克思认为“一种科学只有在成功地运用数学时,才算达到了真正完善的地步。”
自然辩证法、科学论(Science Studies)、科学学(Science of Science) 作为把科学当作一种社会现象来研究探讨的学问同样不应例外。
4
一、科学计量学的产生与发展 把科学作为一种社会现象对其进行定量研究的学科是科学计量学。它被公认为是科学论、科学学的一个重要分支。
与计量经济学(Econometrics)、计量社会学(Sociometrics)的译法不同。Scientometrics不翻译为计量科学学,而是译为科学计量学。
5
纵观科学计量学的发展历程, 可以大致分辨出三个阶段。即:
1.萌发时期(19世纪下半叶到20世纪初) 2.奠基时期(20世纪初到60年代末) 3.发展时期 (20世纪70年代后)
6
1.萌发时期 对科学进行计量研究, 至少可以追溯到一百多年前。那时,已有少数自然科学家对科学的发展进行统计分析。
早期运用统计分析的方法对科学进行研究的代表人物有: 阿尔丰沙·德堪多(Alphonse de Candolle, ) 弗朗西斯·高尔顿(Francis Galton, )
7
1-1.德堪多(Alphose de Candolle)
德堪多是瑞士植物学家, 他深受达尔文进化论的影响, 把自然选择理论应用到了研究人类和人类社会的精神和智力特征, 并于1873 年发表《二百年来科学和科学家的历史》。 德堪多采用统计方法对英国皇家学会、法国科学院、柏林科学院等历史上的成员名单进行了研究, 考察了这些科学家的学科门类、家庭出身、民族背景、宗教信仰的分布情况,分析了遗传、教育、语言、宗教、地理环境等因素对科学发展和科学家成长的影响。
8
德堪多还运用数学方法建立了多个指标来比较各国的科学发展状况。如他对各国的科学家人数及其占国家总人口的百分比、各国百万人口中的院士人数、科学院中的外籍院士人数等进行了统计,并据此对各国进行了排序,由此德堪多被誉为对科学进行计量研究的先驱。
9
1-2.高尔顿(Francis Galton) 高尔顿,厄思马斯·达尔文的外孙,19世纪最多才多艺、最富有探索精神的人物之一。他被誉为是遗传学的探索者和优生学的奠基人、卓越的地理学家以及英国生物统计学派的先驱。 高尔顿嗜好计数,请画师为己作画时,发现画师完成一副肖像画大约需要运笔2万次,恰好同织一双袜子所需的手臂运动次数相同。 高尔顿在科学计量学方面的贡献也是对科学家的统计分析。他的代表作是《遗传天赋》(1869) 和《英国科学家》(1874)。
10
高尔顿对英国伟人进行统计分析后指出:伟人们,包括有所创造的科学家在内,似乎都有血缘关系,且大都出生名门。他的观点后来被人批评为低估了人与社会的复杂性, 过份夸大了生物学原理的适用范围。
高尔顿研究发现,载入《当代2500人》人物传记,或出现于泰晤士报的讣告中的杰出人士占英国人口的两万分之一。其中从事科学和医学的占十分之一。他统计指出,英国优秀科学家占总人口的百万分之一。 高尔顿开创了关于杰出科学家质量分布的研究, 这一研究是后来科学计量学的各种质量分布研究的先导。
11
1-3.科尔(F. J. Cole) 20世纪初,一些学者开始对科技文献的数量进行统计研究。如1917 年动物学教授科尔(F.J.Cole) 和博物馆馆长伊尔斯(N.B. Eales) 发表了题为《比较解剖学的历史——.对文献的统计分析》的论文。 该文统计了 年欧洲各国发表的有关动物解剖学方面的出版物6436件, 并绘制了出版物数量的时间分布曲线, 从此曲线可以较为清楚地看出比较解剖学的发展进程。该曲线与后来的所谓科学发展指数增长规律曲线十分吻合。
12
科尔和伊尔斯在统计数据的基础上,还比较了不同国家比较解剖学的发展状况,确定了不同时期比较解剖学的研究重点等。
科学发展的表现形式之一就是科技文献的迅速增长,科尔等人以文献为切入点对科学进行定量研究开创了科学计量学一个新领域。
13
2.奠基时期 具有现代科学计量学意义的研究起始于美国学者洛特卡(A.J.Lotka, )。但是真正使科学计量研究变成一门科学的,应归功于普赖斯(Derek J.de Solla Price, )和加菲尔德(Eugene Garfield,1926- ) 。 著名的科学社会学家默顿曾于1879年指出:普赖斯《巴比伦以来的科学》、《小科学, 大科学》两部著作的出版和加菲尔德的《科学引文索引》的刊行乃科学计量学发展史上的两件奠基性大事。
14
2-1.洛特卡(A.J.Lotka) 洛特卡生平 1880年3月生于奥地利的伦伯格,父母都是美国人。早期教育是在法国和德国接受的。毕业后,先后在美国化学总公司、国家专利局、国家标准局等机构工作。1938~39年任美国人口协会主席、1942年任美国统计协会主席。
15
洛特卡定律 1926年洛特卡发表了论文《科学生产率的频率分布》。文中他统计了《化学文摘》1907~16年索引中的以A和B开头的6,891名作者及其论著数,并统计了奥尔巴赫(Auerbach)的《物理学史一览表》(1919)中的1,325位科学家及其论著数。 在上述统计分析的基础上,他发现:“写了2 篇论文的科学家人数大约是写了1 篇论文科学家人数的1/4; 写了3 篇论文的科学家人数大约是写了1 篇论文科学家人数的1/9; ⋯⋯写了n 篇论文的科学家人数大约是写了1 篇论文科学家人数的1/ n2 ”。这就是著名的洛特卡定律。
16
结论:写1篇论文的作者数大约占作者总人数的60%。
洛特卡定律的数学表现形式为: fn=c/n2 其中,n为一位作者发表的论文数,fn 为发表n篇文章的科学家占科学家总人数的百分比,c为常数。 因为lim∑fn=1,即c(1+1/22+1/32+···)=1,c(π2/6)=1 所以c=6/π2=0.6079 结论:写1篇论文的作者数大约占作者总人数的60%。
17
洛特卡定律的命运 由于多种原因,洛特卡定律沉睡了30多年,后来由于普赖斯等人的发掘,自60年代起引起人们的重视。
今天,洛特卡定律仍然经常被科学学家、情报学家等引证和研究。
18
继洛特卡之后,英国化学家布拉福德(Samuel C. Bradford,1878~48)和美国语言学家齐夫(George K
继洛特卡之后,英国化学家布拉福德(Samuel C.Bradford,1878~48)和美国语言学家齐夫(George K.Zipf,1902~50)也先后对科技文献进行了定量研究,并提出了著名的布拉福德文献分散定律和齐夫定律。 这些工作无疑对科学计量学的奠基产生了积极的影响。但是人们普遍认为堪称科学计量学之父的只有普赖斯。
19
2-2.普赖斯(Derek J.de Solla Price)
普赖斯生平 普赖斯1922年1月22日生于英国伦敦,46年获伦敦大学物理学博士学位,54年又获剑桥大学科学史博士学位。 1946~47年获英联邦基金资助,赴美国普林斯顿大学从事数理物理研究;1947~50年任新加坡阿拉亚大学应用数学讲师;1950~57年回英国从事科学史研究。其间,结识了英国当时最著名的科学史家李约瑟,并和李约瑟合写了一本题为《天钟装置—— 中世纪中国的伟大天文钟》的著作。与李约瑟的合作奠定了普赖斯的学术声誉。
20
1957年赴美,1958年起任普林斯顿高等研究所Donaldson Fellow,1960年任耶鲁大学科学史Avalon Professor,后升任耶鲁大学科学和医学史系主任。1980年加入美国籍,1983年9月3日在伦敦逝世。 他是一位博学多产的杰出学者,一生发表论文240篇,专著14种。1976 年获美国技术史学会的达·芬奇奖章,81年又获美国科学社会学研究会的贝尔纳奖章。60年代,普赖斯经常去华盛顿为美国总统提供咨询,并以联合国教科文组织等名义走遍世界,产生了广泛的国际影响。
21
科学知识指数增长律的发现 1949年普赖斯在新加坡执教时,负责保管一整套《伦敦皇家学会哲学论坛》。由于十年一叠地放在床头书架上,使得杂志靠墙排成指数曲线状,这个现象被他意外地抓住了。 1950年,普赖斯回欧洲后向荷兰阿姆斯特丹的国际科学史大会提交了他的第一篇有关科技期刊按指数增长的科学计量学论文。该论文不仅标志他从数学和物理学转向了科学史研究,而且也成了他成长为科学计量学之父的起点。
22
Science Since Babylon 《巴比伦以来的科学》
普赖斯取得耶鲁大学科学史教授职位后,曾于就职伊始举行过一次系列讲座。这次讲座共分五讲,他在最后一篇演讲中深入讨论了“科学指数增长”问题。 这次系列演讲的文稿于1961 年结集出版,书名为《巴比伦以来的科学》。出乎普赖斯本人意料,这本书非常畅销,而且在科学学界引起强烈反响。
23
普赖斯在书中以科学文献量为纵轴,以历史年代为横轴,把不同年代的科学文献量在坐标图上逐步描绘出来,然后以光滑曲线连接各点,得出了科学文献随时间增长的指数曲线。
见下图
25
普赖斯研究指出: 期刊数量是按指数而不是线性增长的。…实际上这个常数是,大约每15年左右翻一番,相当于每50年为10倍,每150年为1000倍,从17世纪中叶到现在的300年中增长了100万倍。 从科学期刊中所得到的指数增长规律也适用于这些期刊中的论文实际数量。
26
Little Science, Big Science
《小科学,大科学》 1962年,普赖斯应邀在布鲁克海文国家实验室作了一年一度的“佩格勒姆(Pegram)科学讲演”,他以定量描述科学发展为主线作了四次报告:第1讲“ 科学学序幕”。第2讲“再访哥尔顿”。第3讲“无形学院和无数科学往返者”。第4讲“大科学家们的政略”。 佩格勒姆演讲集于1963年出版问世,这就是著名的《小科学,大科学》。
27
为验证指数曲线的普遍适用性,普赖斯以《化学文摘》等4种文摘和其他30种杂志为例进行了统计分析
他指出:似乎没有理由怀疑任何正常的、日益增加的科学领域内的文献是按指数增加的,每隔大约“10~15"年时间便增加1倍。”“每年增长约5%~10%”。
30
如以15年为倍增周期,发展3个世纪,则相当于2的20次幂的倍增,即达100万这一因数。
科学的大部分是现代的,而大部分科学工作者也都是在世的。 若科学家的倍增周期为15年,则8个科学家中将有7个是在世的,即直接性系数为87.5%。 在下一个10~20年出现的科学工作和科学家将和迄今为止的科学工作和科学家的总和一样多 书中普赖斯还深入探讨了科学增长的极限问题
32
两本著作的影响 《巴比伦以来的科学》和《小科学、大科学》两书在全面继承和发展近一个世纪以来先驱者们对科学进行定量研究成果的前提下,最终为科学计量学研究奠定了理论基础。 正如普赖斯本人1975年在《巴比伦以来的科学》一书扩大再版时说的那样:这两本著作,“引来了一系列旨在对诸如科学期刊数目、论文数目、作者数目以及引证数目等等进行种种计量探索的定量研究。”
33
2-3.加菲尔德(Eugene Garfied)
加菲尔德生平 1925年9月16日生于美国纽约。二战期间参军服役,战后进哥伦比亚大学学习,1949年获化学学士学位,54年获图书馆学硕士学位。1961年又在宾夕法尼亚大学获结构语言学博士学位。
34
早年曾为《化学文摘》做过义务文摘员,在工作中他认识到传统的主题词索引存在着诸多不便,于是萌发了用引文作为检索工具的想法。
1955年他发表论文《引文索引用于科学》,系统地提出了用引文检索科技文献的方法。60年他创办了科学情报研究所(ISI),并于63年编制成《科学引文索引》(SCI)。73年推出《社会科学引文索引》(SSCI)。78年又推出了《艺术与人文科学引文索引》(A&HCI)。
35
《科学引文索引》 《科学引文索引》 1963年试刊 《科学引文索引》 1964年正式刊行
试刊本分5卷,覆盖了613份科学杂志在1961年发表论文的引文的索引,共有近1.4亿条引证。 《科学引文索引》 1964年正式刊行 最初的正式刊行本覆盖了2200份杂志上发表的论文所作的引证,这些杂志都是由各个领域的专家委员会选定的。
36
1963年为年刊, 1964 年改为季刊, 1979 年改为双月刊, 并有年度和5 年度累积本 1985年,SCI摘录来源出版物3367种,报道引用文献620448篇,引文 条。
37
全世界每年出版10 多万种科技期刊。SCI 的编者主要根据“加菲尔德文献集中定律” 及“费用——效果”原则, 在ISI 巨大的自然科学资料库(SCI data base) 中选择入选期刊
主要根据基本期刊出版标准、期刊内容、国际性和引文分析四个方面选择了5877 种期刊组成了外圈———SCI 扩展版, 即SCI Expanded。 再在SCI Expanded中选取3500 余种组成内圈, 即SCI CED。 我国科技界所说的SCI 刊物一般是指进入SCI CED 的刊物。
38
目前,SCI涵盖了3500 余种国际性权威科技学术期刊上发表的论文和引文的数据信息, 是一种国际性、多学科的综合性文献检索工具, 也是进行引文分析的重要工具之一。
它除了收录文献的作者、题目、源期刊、摘要、关键词外, 还收录了论文的参考文献, 是一种以文献之间的引证关系为基础编制的索引。 其报道范围涉及数理化、医药、农业、生物学、工程技术、应用科学和行为科学等 SCI 的主要文献源是期刊, 也收录少量的会议录、专利、图书和科技报告, 收录的引用文献主要是本年度的。其特点是时差短、信息广等。
39
组成分两部分: 特点 1 引文索引〉按被引证作者姓名顺序编排 2 资料索引〉按序列出引证了上述作者论文的论文
可以根据作者名从引文索引部分开始查,然后再从资料索引部分查出所有引用这篇论文的论文。
40
价值 它改变了传统的主题索引的分类方法,是情报检索方法的一次重大变革。 可以查明论文间的相互引证关系,追踪给定论文的来龙去脉。
具有主题索引所没有的评价、分析和预见的功能。
41
普赖斯和加菲尔德的研究深深吸引了前苏联莫斯科大学纳利莫夫和乌克兰科学院的多勃罗夫。
后来,也正是因为他们两人的努力和推动,科学计量学不仅在前苏联,而且在世界许多国家(如匈牙利)变成了一个迅速成长的新领域。
42
3.发展时期 1969年世界上第1本科学计量学专著问世,是由前苏联学者纳利莫夫(V.V.Nalimov, )和穆利钦科(Z.M.Mulchenko)合著的《科学计量学:把科学作为情报过程来研究科学的发展》。俄语术语“科学计量学”正式被创造出来。同年也有了英语“Scientometrics”。这标志着奠基期基本完成,从此跨入发展时期。
43
3-2.验证与完善科学计量学定律 3-1.建制化的发展 3-3.科学计量学在中国 1978年国际《科学计量学》杂志的创刊号在匈牙利出版。
1982年,《科学计量学》杂志合并了《学术交流研究杂志》。 1984年,“普赖斯纪念奖章”设立。 1987年首届国际文献计量学、科学计量学会成立 3-2.验证与完善科学计量学定律 3-3.科学计量学在中国
44
二、科技文献计量研究成果简介 加菲尔德编SCI的用意在于方便情报检索,他“从未想到大规模引文索引的问世,会刺激科学计量学这一全新科学领域的发展”。
45
1.引文分析 《科学论文的网络》 1965年,借助于刊行不久的《科学引文索引》,普赖斯在《Science》上发表了一篇著名的论文:《 Networks of Scientific Papers》。在这篇论文中,他创造性地研究了科学论文之间的引证和被引证关系,以及由此形成的所谓“引证网络”。 普赖斯研究指出:
46
施引方面 每篇论文平均引证参考文献数目是15篇,其中13篇是期刊论文,而另2篇是图书等其他类型参考文献。
普赖斯估算,如果世界文献量每年以7%的速度增加,那么,100篇论文会有105篇引文。即每篇论文每年差不多被引用1次多一点。
47
被引方面 在任何一年里,大约有35%的论文不曾被任何文献引用,有49%的论文只被引用1次,所余的16%的论文平均被引用3.2次。
其中,大约9%的论文被引用2次,3%的论文被引用3次,2%的被引用4次,1%的被引5次,余下的1%被引5次以上。 结论:被引的减少比引用的减少要快。
48
“经典文献” 普赖斯认为,除评论性文章之外,凡每年被引证4次以上的论文,即可列为“经典文献”。
按上述标准,则在数学、地质学和植物学中,大多数是经典之作;在化学工程、机械工程、冶金工程和物理学中,大多数是昙花一现之作;在化学和生理学中,则两者各半。
49
“引文网络图” 普赖斯还指出:某一年里,受引与施引之间存在一种平衡,这种平衡就是引文网络图。根据网络图,他认为,某一年引用的所有受引论文发表日期存在一个研究峰值,并推断:发表于1961年前15年的所有论文与一篇1961年所发表的论文可引用的概率几乎相同。
50
“科学地形图” 普赖斯认为,在网络图上,必有密集分布的小条或小块,如果把这些小条和小块研究清楚,就可以绘出当代科学的“地形图”。随着这幅“科学地形图”的建立,人们就可以指明,各类期刊、各个国家、各国科学家、各种科学论文在科学地图应当占有的位置、他们之间的相对联系和相对重要性。
51
2.学术评价 2-1. 对学术期刊的评价 概念 引用频率(Citation Rates) :指在一定时间内文章被人们所引用的次数
2.学术评价 对学术期刊的评价 概念 引用频率(Citation Rates) :指在一定时间内文章被人们所引用的次数 影响因子( Impact Factors):指某一期刊前二年内发表的所有论文数与该年这些论文被引用的总次数的比值” 。简而言之, 影响因子就是期刊发表的论文1到2年后的平均被引用频率。 IF=C/N N:前两年发表的论文总数,C:某年的被引用总数。
52
例:信息科学类期刊影响力排名
53
物理学杂志的IF一般为1~3,低于生物化学、医学类杂志的IF。
Nature : N.Engl. J. Med: Science: Lancet: P.Natl.Acad.Sci.USA:10.667 物理学杂志的IF一般为1~3,低于生物化学、医学类杂志的IF。
54
1988年SCI收录我国科技期刊14种,其中影响因子最高的《中国科学·B辑》为0. 157,世界排名3470;A辑IF为0
1996年中国科学引文数据库的统计结果是: 《中国科学·A辑》、 《中国科学·B辑》分别为0.3136、0.5853。影响因子最大的是《岩石学报》,其值为0.7471;引用频次最高的是《科学通报》,达1744次。 中国的期刊不仅仅存在语言问题
55
SCI收录我国科技期刊情况
56
我国科技期刊的影响因子
57
2-2. 对学者个人的评价 SCI论文数、被引用次数 1961年,物理、化学、医学领域被引用次数:
一般学者5.51,诺贝尔奖获得者169,相差30倍 平均每篇文章的被引证次数为: 一般学者1.57,诺贝尔奖获得者2.9
58
1961~1975年间诺贝尔奖获得者被引证次数: 162位中最高的是L.D.Landau18888, 最低的是J.H.Jensen79。只有6位低于200次,平均为2877次。一般学者50次 1961~1975年间引文数最高的250位中,42位(17%)诺贝尔奖,151位(60%)为国家科学院院士。 1967年引文数最高的50人中,6位获诺贝尔奖,后来又有6人获奖。预测1969年的获奖人选中有2人命中
59
诺贝尔奖获得者田中从未发过一篇SCI论文
70年代宾西法尼亚大学用此方法成功地解决了一项人事聘用纠纷。 但是,一味地用它来评价个人业绩也存在很多问题。主要是不太好处理数量与质量的关系。 诺贝尔奖获得者田中从未发过一篇SCI论文
60
从SCI论文看日本诺贝尔获奖者的研究业绩
62
利根川合著论文中,nuture 28, science 9
野依的一本书7年里被引用的次数超过1100
65
小柴和田中论文数都很少,仅受奖论文的引用率比较高
小柴在获奖论文中的排名仅为第3 田中SCI论文一篇都没有,刊登获奖论文的杂志发刊才2年,没有被SCI收录,3年后才被SCI收录。 田中论文10年间才被引用约220次
67
2-3. 对学术组织的评价 用SCI论文数评价学术组织有其合理性 中国科学引文数据库1996年统计结果:
北京大学被引论文411篇,被引频次534次。远高于其他高校和科研机构。当时北医大、南京大学分居第2、3,被引频次440、419。 这基本反映了中国高校的科研实力现实
68
北京大学2001年SCI收录论文统计分析
73
日本大学发表的SCI自然科学类论文数排名
74
问题点: 政府支出单位研究费的引用数 团体与个人的差异 数量与质量的差异
75
2-4.SCI论文的一些统计分析结果
82
三、问题
83
3-1.被引论文数与引文动机 1971年,M. Weinstock列出了15中引用动机: 对前人表示敬意 对相关工作表示肯定
表明使用的方法、仪器设备等 提供背景资料 改正自己的错误 纠正他人的工作 批评以前的工作 为论断寻求依据 提请注意即将发表的工作
84
对很少传播、标引或未被引证的工作提供线索
鉴别数据和事实的分类等 辨明讨论了某种思想、概念的原始出版物 辨明描述以人名命名的概念术语的原始出版物 否定他人的工作和观点 对他人的优先权提出异议
85
1977年F.C.Thorne列出了19中不遵守学术规范和学术道德的乱引行为:
互相吹捧 奉承名人 迫于压力 迎合编辑偏爱 寻求经济资助 反映行业不合 多余引用 等等
86
3-2.设计缺陷 SCI目前收录世界上3500余种期刊,内容涵盖150多个学科主题。 只是期刊中的一小部分 对非英语文献重视不够
引文对多著者不做处理 1994年,合著人数50人以上400余篇; 100人以上200篇 同名异人与同人异名 Wang J,1988年被引349,1989年达521
87
THE END
Similar presentations