文献检索(信息检索) 第三章 信息检索基本知识 第一节 信息基本知识(信息、知识、情报、文献基本概念及相互关系 ) G252.7/160=2
第一节 信息、知识、情报、文献基本概念及相互关系 一、信息 (一 )信息的概念 据不完全统计,信息的定义有100多种,它们都从不同的侧面、不同的层次揭示了信息的某些特征和性质,但至今仍没有统一的、能为各界普遍认同的定义。 在经济学家眼中,信息是与物质、能量相并列的客观世界的三大要素之一,是为管理和决策提供依据的有效数据。 对心理学家而言,信息是存在于意识之外的东西,它存在于自然界、印刷品、硬盘以及空气之中。
在新闻界,信息对事物运动状态的陈述,是物与物、物与人、人与人之间的特征传输。而新闻则是信息的一种,是具有新闻价值的信息。 哲学家们从产生信息的客体来定义信息,认为事物的特征通过一定的媒介或传递形式使其它事物感知。这些能被其它事物感知的、表征该事物特征的信号内容即为该事物向其它事物传递的信息。 所以,《中国大百科全书》的定义:信息是关于事物运动的状态和规律的表征,也是关于事物运动的知识。它是用符号、信号或消息所包含的内容,来消除对客观事物认识的不确定性。
信息论的奠基人 申农在《通信的数学理论》中把信息定义为:“信息是用来消除不确定的东西。”
控制论创始人 维纳在《信息控制论》一书中指出:“信息是人与外界相互作用过程中相互交换的内容和名称。” 控制论创始人 维纳在《信息控制论》一书中指出:“信息是人与外界相互作用过程中相互交换的内容和名称。”
“信息”的定义之所以呈现多样化,主要有三方面的原因 : 第一,信息本身的复杂性。它是一个多元化、多层次、多功能的综合物; 第二,信息科学是一门新兴学科,是一门“大”学科,它有许多分支学科,它的内涵与外延不很确切,而且随着社会、经济和科学技术的发展处于不断发展之中; 第三,人们出于不同的研究目的或使用目的,从不同的角度或层次出发,对“信息”必然作出不同的理解与解释。
2.信息的特征 (1)传递性 所谓信息的传递过程,是指客观存在的信息通过人的智慧被感知以后将其转换成语言、文字、图形、代码等可接受的形式进行传递。信息在时间上的传递体现了信息的可存储性,在空间上的传递体现了信息的可扩散性。 信息的获取必须依赖于信息的传递
信息传递的非正式渠道 信息传递的正式渠道 利用正式出版物 参加学术讨论会、参 观、访问、座谈、同行书信 往来等
(2)时效性 信息所反映的总是特定时刻事物运动的状态和方式,当人们将特定时刻的信息提取出来后,事物仍不停地运动着,这样脱离了源物质的信息就会逐渐失去效用。因此只有及时地将信息加工、收集、传递,才能充分利用信息。(刻舟求剑,人们不能两次踏进同一条河流) (3)共享性 信息的共享性是指同一内容的信息可以在同一时间被两个或两个以上的用户分享,其分享的信息量不会因分享用户的多少而受影响、受损失。
(4)客观性 信息是事物运动的状态和方式,是客观存在的,是不以人的意志为转移的。它包含三层意思:一是信息来源于物质,又不是物质本身,可以脱离源物质相对独立地存在。二是它也来源于精神世界,但又不限于精神的领域。三是它又是具体的,可以被 人所感知、提取、识别,可以被传递、存储、变换、 处理、显示、检索和利用。 (5)普遍性 一切事物运动的状态和方式都是信息,而宇宙时空中的事物是无限丰富的,因而它们所产生的信息也必然是无限量的。
(6)存储性(依附性) 信息必须依附在一定的载体上才能被识别和使用,并且随着人类社会的发展和科学技术进步,信息的存储手段和存储介质都在不断改进,如现在的存储介质有纸张、胶片、磁带、磁盘、光盘、硬盘、阵列等 (7)扩散性 信息在时间上的传递体现了信息的可存储性,信息在空间上的传递则体现了信息的可扩散性。信息的传递使信息可以通过多种渠道 和方式迅速广泛地扩散开来,尤其在目前的网络环境下,信息的扩散性就表现得更为明显
(三)信息的种类 按信息的的来源:自然信息、社会信息、知识信息 按信息的学科内容和应用:政治信息、科技信息、经济信息、军事信息、教育信息等 按信息所依附的载体:文献信息、口头信息、电子信息、生物信息等 按信息的记录符号:语声信息、图像信息、文字信息、数据信息等 按信息的加工层次:初始信息(感知信息、原生信息)和再生信息(二次信息、三次信息)
二、知识 (一)知识的概念(数不清的定义) 1.知识是人类在改造客观世界的实践中获得的认识与经验的总结,是人的主观世界对客观世界的摡括和反映,是人的大脑通过思维对客观事物本质与规律性的认识和掌握。 2.知识是对事实或思想的一套有系统的阐述,提出合理的判断或者经验性的结果,它通过某种交流手段,以某种系统的方式传播给其他人。(美国社会学家丹尼尔·贝尔) 3.人类对客观世界的认识,是人类认识的成果或结晶。
4.从信息观的角度理解,知识是人类通过信息对自然界、生物界、人类社会运动规律的认识和概括,是一种特定的人类信息,它是对信息进行提炼、深化、抽象化、系统化的结果,是信息中最有价值的部分。知识是信息的一部分。 知识必须要有充分、可靠的经验性证据,并且要经过理性的合理加工。
(二)知识的特性 1.实践性 社会实践是一切知识产生的基础和检验知识的标准,科学知识对实践有重大指导作用。 2.规律性 人们对事物的认识是一个无限的过程,人们获得的知识在一定层面上揭示了事物及运动过程的规律性。 3.渗透性 随着知识门类增多,各种知识可以相互渗透,形成许多新的知识门类,形成科学知识的网状结构体系。
4.继承性 每一次新知识的产生,既是原有知识的深化与发展,又是更新的知识产生的基础和前提。知识被记录或被物化为劳动产品后,可以世代相传和利用。 5.信息性 知识来源于信息,是经人类认识、理解、重新整合并系统化的信息,是信息的一部分。 6.意识性 知识是观念形态的东西,通常以概念、判断、推理、假设、预言等思维形式存在,是由人脑产生、认识和利用的。
(三)知识的类型 1.显性知识和隐性知识(知识的属性) 显性知识指用书面文字、图标和数学公式表示的知识。 隐性知识是指工作诀窍、经验、思想、观点、价值体系等 。它存在于人们的头脑中,不能明确地观察到。 2.实体知识和过程知识(知识运动状态) 静态的观点来看,将知识看成一个个物质“实体”,在管理“实体知识”的过程中,重点在于识别、收集、组织、分析知识。 用动态的观点来看 ,将知识看成一个过程,持这种观点,把注意力更多地集中于知识的共享、创新、适应、学习、运用和沟通这一动态过程。
3.1996年国际经济合作与发展组织发表的《以知识为基础的经济》报告中。将知识分为以下几种类型(1)事实知识(Know-what),关于事实的知识,这类知识通常近似地称为信息;(2)原理知识(Know-why),关于自然原理和规律方面的科学理论,这类知识大爽在专业研究机构和大学里形成;(3)技能知识(Know-how),做某些事情的技艺和能力,许多企业的技术情报、商业秘密、技术诀窍或专业技术;(4)人力知识(Know-who),到哪里寻求知识的知识。 4.个人知识和社会知识:社会知识是个人知识的源泉,而个人知识的不断积累又会产生新知识,新知识进一步丰富了社会知识。
三、情报 (一)情报的概念 情报是对特定传递对象在特定的时间内有特定价值的信息或知识。 情报来源于知识或信息,是“活化”或“被激活”的知识或信息,具有明显的针对性、准确性、可靠性和适用性的知识或信息。必须在特定的时间内经过及时传递,并能为特定用户所接受和利用。 (“鸡毛信”、高考成绩单、新药配方)
(二)情报的特征 1.动态性 情报的生产和传递环境变幻多端,反复无常,要想在竞争环境中立于不败之地,必须及时获取动态的情报。 2.按特定方式传递 它是由情报机构或人员搜集、加工、制作开发的活的知识和信息,按情报的运行规律向特定的用户传递的。
3.为特定的目的服务 情报具有适应“特定需要”的个性特征。它表示其用户所需的情报是有特定要求和指向的。 4.常常带有效性和机密性。 情报具有“秘密”的个性特征,它的作用和价值,为一般人所不知,也不宜公开。
四、文献 (一)文献的定义 1.国际标准化组织《文献情报术语国际标准》:文献是存储、检索、利用或传递记录信息的过程中,可作为一个单元处理的、在载体内、载体上或依附载体而存储有信息或数据的载体。 2.国家标准《文献著录总则》:文献是记录有知识的一切载体。 北大教授王子舟《图书馆学是什么》:是指专门记录、传播有知识的一切载体。 南大教授沈固朝《信息检索(多媒体)教程》:记录有人类精神信息的、且便于存贮或传递的人工固态附载物
(二)文献的构成 现代文献由四要素构成:文献信息(知识信息)、文献载体、符号系统和记录方式(记录手段),四要素缺乏任何一种都不可能形成文献。 文献信息(知识信息)是文献的内容, 符号系统是信息的携带者,是指图画、文字、公式、图表、编码、声像和电磁信息等。 文献载体是符号赖以依附的“寄主”,纸质、缩微、声像、电子等 记录方式(记录手段)则是代表文献的符号进入载体的方法和过程。(活字印刷雕版印刷、激光照排、光盘刻录等)
(三)文献的类型 1.按文献载体划分 (1)印刷型文献 指通过油印、铅印、胶印、复印等各种印刷手段将信息记录在纸张或其它载体(绢帛、木板、铁皮等)上的信息资源. (图书、期刊、报纸、档案、技术标准、专利说明书、产品说明书、广告等) 优点:使用方便,易于携带和阅读, 缺点:体积大,不易整理和保存。
(2)缩微型文献 指以印刷型文献为母本,利用光学技术将纸质文献按一定比例缩小存储在感光材料上的一种文献。(缩微胶卷、缩微平片、缩微卡片等),是印刷型文献另一种记录和阅读形式。 特点:体积小易保存,存储密度高 缺点:借助阅读机才可阅读、使用
(3)声像型文献 指通过专门的设备,使用声、光、电、磁等技术将信息以声音、图像等形式记录下来的信息资源。 包括:唱片,录音带,录像带,电影胶片, 电视片、幻灯片等 特点:非文字形式的文献,直观形象 缺点:需要专门的设备。
(4)电子型文献 通过编码技术将信息转换为计算机可识别的语言,并将信息记录在磁带、磁盘(计算机磁盘、U盘、移动硬盘、数码设备等) 、光盘等载体上的信息资源。通过计算机存取、处理和阅读的信息资源。 主要有:电子图书,电子期刊,电子会议录等 特点:体积小,存储量大,存取速度快,可共享 缺点:设备昂贵,保存条件较高、使用费用高
(5)网络型文献 以数字形式存储在各种网络服务器(客户端)上,通过网络传输、获取和利用的信息资源。是电子型信息资源的一种。 主要有:联机杂志、电子杂志、数据库、电子工具书、报纸、专利信息等 特点:传递网络化,检索功能强、途径多、速度快,发行周期短、内容更新快、信息获取及时。 缺点:安全性差,易受计算机病毒和黑客攻击 费用较高。
2.按出版类型划分: 文献分为:图书、期刊、报纸、科技报告、会议文献、专利文献、学位论文、标准文献、政府出版物、产品样本、档案、灰色文献) (1)图书(国家标准对图书的定义:一般不少于49页并构成一个书目单元的文献) 图书是通过一定的方法与手段将知识内容以一定的形式和符号,按照一定的体例,记录于一定载体上,用于保存和传播知识的出版物。它是对已有的研究成果、生产技术、实践经验或某一知识体系的概括和论述。 特点:内容全面、系统,相对成熟、可靠 缺点:出版周期较长,时效性较差,传递新信息的速度慢。
图书可以帮助人们比较全面系统地了解某一特定领域中的历史和现状。可以作为人们掌握某一学科专业领域基本知识的入门指导工具或者是查检工具。 每一种图书一般都有惟一的标识既国际标准书号—ISBN号。如: ISBN 7-302-06006-1/TP.3583 7-汉语区(语言区域代码)、 302-清华大学出版社(出版社代号)、06006-图书出版流水号(书顺号)、1-计算机校验码、TP -中图法分类号、3583是TP类种次号
是一种有固定名称,统一出版形式,定期或不定期的连续出版物。 (2)期刊 是一种有固定名称,统一出版形式,定期或不定期的连续出版物。 特点:出版周期短,报道速度快,数量大,内容丰富新颖,能及时反映当代社会和科技的发展水平和动向,是交流学术思想最基本的文献形式。期刊论文的时效性强,必须及时加以查找和利用。 期刊按内容分为学术性期刊、通报性期刊、技术性期刊、科普性期刊、动态性期刊、综述与述评性期刊和检索性期刊等
科技期刊与专利文献、科技图书三者被视为科技文献的三大支柱,也是科技查新工作利用率最高的文献源。 国际标准连续出版物号—ISSN号,例如: ISSN 1002-4670 –国际贸易问题 前七位表示国别,语区和种次号,最后一位是计算机校验码
(3)报纸 是一种连续出版物,是“以刊登新闻和时事评论为主的定期连续向公众发行的散页出版物”。与期刊相比,发行周期短,报道速度快。文章篇幅短小,以新闻、动态报道为主。报纸信息量大,具有极强的时效性 多数报纸有网络版和光盘式的累积版,查阅相当方便。
(4)会议文献 指在各种学术会议上宣读、交流、发表的论文、报告和其它有关资料。分会前文献和会后文献。会前文献主要指论文预印本和论文摘要,会后文献主要指会议的论文汇编。有不少会议文献在期刊上发表。 会议文献学术性很强,内容新颖、质量较高,往往能代表某一领域的最新研究成果及水平,从中可了解国内外科技发展趋势,有较大的参考价值,是重要的信息来源。
(5)专利文献 专利是指发明人创造发明了某种新技术,通过一定的申请程序,经政府专利局审批后,即获得一定年限的垄断权。 专利分为发明专利、实用新型专利、外观设计专利,是一种知识产权,在专利有效期限内可以交换、继承、转让。 专利有三种含义:专利权、受到法律护的发明创造、专利文献。
是各国专利局以及国际性专利组织,在审批专利过程中产生的官方文件及其出版物的总称。包括发明专利申请书、发明专利说明书、专利局分开出版的各种检索工具书(如专利公报、专利年度索引等)以及有关发明的其他类别的文件。 我国出版的专利文献包括:发明专利公报、实用新型专利说明书和外观设计专利公报;发明专利申请公开说明书、发明专利说明书;实用新型专利说明书;专利年度索引。 专利文献特点:数量庞大、报道快,学科领域广阔、具有新颖性、实用性和可靠性。目前情报价值越来越大,使用率也日益提高。
(6)学位论文 指高等院校或研究机构的毕业生和研究生为取得学位,在进行科学研究后而撰写的学术论文。 学位论文都是就一专题进行全面的文献调查,比较详细地总结前人的工作和当前的研究水平,并作系统的实验研究及理论分析,一般都具有独创性,其数据较全,探索较深,并附有大量参考文献,是一种重要的文献来源。 学位论文级别可分为:学士论文,硕士论文,博士论文。国内法定收藏学位论文的指定单位是中国科学技术信息研究所(理工硕士论文)、社科院文献中心(文科的硕士论文)国家图书馆(文理科博士论文和博后的科技报告)。国内学位论文有万方,CNKI优秀博硕论文库。
(7)科技报告 是政府、科研、企业等部门围绕某一专题进行研究取得成果的总结,或研究过程中的阶段进展记录。报告的类型有技术报告、札记、论文、备忘录、通报、可行性报告、市场预测报告、进展报告、初步报告、中间报告、最终报告等。 出版特点是各篇单独成册,统一编号,信息新颖、叙述详尽、保密性强,有固定的机构名称和较严格的陈述形式的特点。
科技报告在内容上比期刊论文等专深、详尽、可靠,能反映一个国家、某一学科领域、某一行业或某一部门的最新科研水平,是一个重要而又不易获取的信息资源。 美国政府四大报告:PB报告(政府,美国政府出版局)、AD报告(军事,美国武装部队技术情报局)、NASA(航天,美国国家航天和宇宙航行局)、DOE报告(能源,美国原子能委员会)
(8)标准文献 技术标准、技术规格和技术规则等文献的总称。是纪录人们在从事科学试验、工程设计、生产建设、商品流通、技术转让和组织管理时共同遵守的技术文件。可作为了解各国的技术政策、经济政策、生产水平和标准化水平参考,也可为组织生产活动和制定出口策略提供依据 是一种经权威机构批准的规章性文献,具有一定的法律约束力。按适用范围分:国际标准(ISO-),区域性标准、国家标准(GB-),行业标准(JX-)、地方标准。
(9)档案文献 是生产建设中和科研部门在技术活动中形成的具体工程对象的技术文件、图纸、图表、照片和原始记录等总称。包括:任务书、协议书、审批文件、研究计划、技术指标、技术措施、调查材料、设计材料、试验资料、工艺记录等。 它是科研生产中用以积累经验、吸取教训的重要文献,大多由各系统、各单位分散收藏,一般具有保密和内部使用的特点、具有很高的参考价值。。
(10)产品资料 指产品目录、产品样本和产品说明书等厂商产品宣传和使用的文献资料。包括产品目录、单项产品样本、产品说明书、企业介绍和广告性厂刊。 产品样本通常对定型产品的性能、构造、规格、用途、操作规程、维修、价格等具体说明。 收集产品样本有助于了解某类产品的水平、现状和发展动向,对于新产品的设计、试制,对于产品的选购、使用都有很高的参考价值。它是一种保贵的科技信息源、商贸信息源和竞争情报源
(11)政府出版物 指各国政府部门及其所属机构编辑并授权指定出版商出版的文献。政府出版物的内容无所不包,涉及到人类生活、自然科学和应用科学的各个领域。 主要包括行政性文献和科学技术文献两种。白皮书、蓝皮书、绿皮书、红皮书等称呼。 政府出版物是了解一个国家方针、政策、科学技术和经济、生活现状的权威性信息来源。
3.按文献加工层次划分 (1)一次文献 也称原始文献,是以作者本人的科研工作成果并在社会上公开交流或发表的文献。 包括:专著、期刊论文,科技报告,会议论文,专利文献,学位论文等 特点:真实、具体,具有新颖性,创造性等特征,参考和使用价值较高。但也有分散、数量庞大而查阅不便的缺点。 是人们学习参考的最基本的文献类型,是文献检索和利用的主要对象,是产生二、三次文献的基础。
(2)二次文献 检索性文献。是将分散无序的一次文献进行加工整理,使之成为系统有序的信息资源。如文摘、索引、目录、题录等。 特点:具浓缩性,汇集性,有序性等,是查找一次文献的工具,帮助人们在较短的时间内获得较多的文献信息,是重要的指示性信息源。
文献举例 一次文献 二次文献
(3)三次文献 指在一次文献和二次文献的基础上,进行综合、分析,研究和评述而编写出来的再生文献。如手册,百科全书,年鉴,词典、大全、数据手册、文献指南、索引与文献服务目录、书目之书目、工具书目录以及专题述评、总结报告、动态综述、进展报告和未来展望等。 三次文献源于一次文献,又高于一次文献,是一种再创性文献。
(4)零次文献 是指未经刊载、未经公开交流或未经正式出版发行的最原始的文献。包括:个人通信,手稿,私人笔记,考察记录、调查稿、原始统计数字、技术档案、实验记录、会议记录、论文草稿、设计草稿、等。 特点:内容新颖,内部档案、具有原始性。缺点:不成熟,分散,难以获得。 一般通过参加报告会、口头交流、参观展览或现场等途径获取。
文献级别 文献的利用 一次文献 二次文献 三次文献
三次文献之相互关系 一次文献是基础,是检索利用的对象,二次文献是检索一次文献的工具,三次文献是在利用二次文献的基础上对一次文献的高度浓缩。
5.信息、知识、情报、文献的关系 信息 文献 知识 情报 大脑加工 产生 自然现象、社会现象 信息 记录 文献 知识
信息、知识、情报、文献的关系 信息反映事物运动的状态及其变化方式,知识是研究事物运动的状态及其变化方式的规律性。只有通过对信息的加工才能获得知识,如果没有信息也就根本无从谈知识;知识是信息的升华的结果,也是一种浓缩的系统化的信息。信息是知识的基础,知识是信息的核心。 知识、信息被记录在一定的物质载体上,形成文献、文献必须包含知识内容,文献经过传递、传播、应用于理论和实践,而后又产生新的信息运用到实际工作需求中,经过实践的检验形成或产生新的现象、信息、知识,新信息、知识被记录在一定的物质载体上,于是形成新的文献,周而复始。
知识是信息的重要组成部分,只有将反映自然现象和社会现象的信息经过加工,上升为对自然和社会发展客观规律的认识,这种再生信息才构成知识。 情报就是对特定对象在特定的时间内为一定的目的而传递的有特殊效用的知识和信息。 文献是记录有知识一切载体。信息是情报和知识的载体;情报是特指的专业信息; 知识是信息的内核,知识依存于信息,信息经过提炼和加工可成为知识; 知识是信息中的精华部分;信息的价值取决于其精华部分的价值。
思考题: 1.信息、知识、情报、文献的概念以及四者之间关系? 2.文献按出版形式可划分哪几种?按加工层次可划分哪几种?