Presentation is loading. Please wait.

Presentation is loading. Please wait.

科技信息检索与利用 北京工业大学图书馆 信息咨询部 刘彩娥 2008.9.

Similar presentations


Presentation on theme: "科技信息检索与利用 北京工业大学图书馆 信息咨询部 刘彩娥 2008.9."— Presentation transcript:

1 科技信息检索与利用 北京工业大学图书馆 信息咨询部 刘彩娥 2008.9

2 关于这门课 教学方式: 课堂讲解演示+课堂实践+课后实践 学时学分: 32学时,2学分 考 试: 开卷考试,基础知识+检索实践题目
考 试: 开卷考试,基础知识+检索实践题目 我的联系方式: Tel: 北京工业大学 2008年 9月

3 信息检索对研究生有什么作用? 1.获取自己学习和研究所需要的文献; 2.了解与自己的研究课题或研究方向相关的学术成果,掌握学术发展动态;
3.分析文献信息,启发研究思路; 4.获取必要的学术信息(如会议信息、专家信息、刊物信息等) 北京工业大学 2008年 9月

4 这门课学习什么内容? 1.基础知识(文献、文献检索、计算机检索) 2.中英文数据库的检索
( 中文: cnki 、万方、维普;英文: 全文数据库, SDOL Wiley等,文摘数据库,EI SCI等 ) 3.特种文献   专利文献 会议文献  学位论文 标准文献等 4.网络资源 5.围绕课题查资料,通过一定的线索获取全文 6.科技工具书的使用 7.学术信息评价与投稿指南 北京工业大学 2008年 9月

5 基 础 知 识 一、从信息到文献 、文献检索 、计算机检索 北京工业大学 2008年 9月

6 信息素养 (Information Literacy)
1.定义 国内对于信息素养的定义:信息素养是一种有效发现自己的信息需求,并据此从各种不同的信息来源中寻找、检索、获取、判断和组织信息以及利用、交流和传播信息的能力,其实质是在学习、工作中利用信息的意识和技能。 2.内容 信息素养的内涵主要包括三个方面的内容:即信息意识素质、信息能力素质和信息道德素质。信息意识是先导,信息能力是核心,信息道德是保证。 相关素养:信息技术素养;计算机素养;图书馆素养;科学素养 3.特征 概括起来,信息素养主要具有五大特征:捕捉信息的敏锐性、筛选信息的果断性、评估信息的准确性、交流信息的自如性和应用信息的独创性。 北京工业大学 2008年 9月

7 从信息到文献 信息的概念有一百多种,总起来说信息是客观世界在人的大脑中的反应。文献是信息的一种,是经过整理加工的规范化的信息。
文献 ( literature、document) 我国颁布的《中华人民共和国国家标准—文献著录总则》(GB/T )中文献的定义为:“记录有知识的一切载体” 。 文献由三个要素构成,知识、载体、记录方式三位一体不可分割。知识是内容,载体是形态,记录方式是构成文献的手段。 北京工业大学 2008年 9月

8 1.1文献的种类 (1)印刷型文献 (2)缩微型(现在很少使用) (3)声像型文献(视听资料) (4)电子型文献 一、按载体形式划分
北京工业大学 2008年 9月

9 二、按加工层次分: 一次文献(Primary Document): 通常是指原始制作,即作者以本人的研究成果为基本素材而创作(或撰写)的文献。如期刊论文、专著、会议论文、专利说明书、科技报告   二次文献(Secondary Document):是指文献情报工作者对一次文献进行加工整理后所得到的产物,也是为了便于管理和利用一次文献,由文献情报工作人员编辑、出版和积累起来的工具性的文献。二次文献的重要性在于可以帮助人们查找一次文献。如目录、题录、文摘、索引、各种书目数据库 大量的印刷版、网络版检索工具都是二次文献。 网络版的检索工具的优势在于可以有全文连接,这样,查找一次文献一步到位。   三次文献(Tertiary Document):是指利用二次文献,选用一次文献内容,经综合,分析和评述后形成的指南性文献。 如综述、述评、词典、百科全书、年鉴、指南数据库、书目之书目 北京工业大学 2008年 9月

10 图书 期刊 报纸 科技报告 会议文献 专利文献 标准文献 学位论文 政府出版物 产品资料 科技档案
三、按内容与出版形式划分   图书 期刊 报纸 科技报告 会议文献   专利文献  标准文献  学位论文 政府出版物 产品资料  科技档案 北京工业大学 2008年 9月

11 图书 阅读型 : 教科书(Textbook)、 专著(Monograph)、 文集(Anthology)等
工具型:  词典(Dictionary)、   百科全书(Encyclopedia)、   手册(Handbook)、   年鉴(Yearbook)等 特点:成熟,全面,系统,可靠;但时效性差 北京工业大学 2008年 9月

12 期刊或连续出版物 期刊(Journal 或periodical):又称连续性出版物(serials),是一种定期或不定期连续出版的文献载体,它一般有同样的名称,按一定时间编定卷号,每一卷又分若干期。其类型有:   1. 学术型,例如:《中国科学》、《数学物理学报》等;      2. 快报型,例如:《Chinese Chemical Letters 》等,这类期刊不刊登研究性论文,而仅仅是有 关某一领域的发展动态、前沿报道、综述等文章;   3. 资料型,例如:《国际资料信息》、《武汉文史资料》等;   4. 休闲型,又被称为“杂志”。例如《时装》、《读者》等。 特点:内容新颖、信息量大、出版周期短、传递信息快、传播面广、时效性强 用途:获取最新研究成果和动态   目前,全世界每年出版各类期刊达15万种以上,我国现有期刊9000多种,据统计,科研人员从期刊中得到的信息约占65%以上,是十分重要的情报源。 北京工业大学 2008年 9月

13 学术性期刊: 快报性期刊: 检索性期刊: 注意:期刊有多种类型,不能仅仅根据名称来判断是否 是期刊。
一般性期刊Journal,汇刊Transactions,各种学报Acta, 通报Bulletin, 评论Reviews,进展Progress等 快报性期刊: 各种通讯Letters,短讯News等 检索性期刊: 索引index,文摘Abstract

14 核心期刊 某学科(或某领域)的核心期刊,是指那些发表该学科(或该领域)论文较多、使用率(含被引率、摘转率和流通率)较高、学术影响较大的期刊。
 核心期刊 某学科(或某领域)的核心期刊,是指那些发表该学科(或该领域)论文较多、使用率(含被引率、摘转率和流通率)较高、学术影响较大的期刊。 北京工业大学 2008年 9月

15 中文核心期刊 目前,判断中文期刊是否核心刊有以下三种标准 1 北京大学图书馆主编的《中文核心期刊要目总缆》
  1 北京大学图书馆主编的《中文核心期刊要目总缆》   2 中信所的《中文科技期刊引证报告》 3 南京大学的《中文社会科学期刊引证报告》 以下两个也可以参考 4 中国科学引文数据库CSCD ( 分为核心库和扩展库。 5 《中国人文社会科学核心期刊要览》。它是由中国社会科学院文献信息中心和社科文献计量评价中心共同建立的核心期刊库. 北京工业大学 2008年 9月

16 影响因子=(该刊前两年发表论文在统计当年被引用的总次数)/(该刊前两年发表论文总数)。
期刊影响因子( Impact Factor) 影响因子=(该刊前两年发表论文在统计当年被引用的总次数)/(该刊前两年发表论文总数)。 比如:<Science>杂志1996年的影响因子计算方法: 1995年共出版文献1037篇,1994年共发表文章1054篇. 1995年的文章在1996年被引用24189次, 1994年的文章在1996年被引用25170次, 1996年的影响因子= / =23.605 《中文科技期刊引证报告》、《中文社会科学期刊引证报告》可以查中文刊物的影响因子。 被SCI收录的刊物影响因子可以检索JCR(Journal Citation Report) 北京工业大学 2008年 9月

17 被引半衰期(Cited Half-Life)指期刊达到50%被引用率所需的时间。有助于您评估该期刊中文献被引用的时间跨度
评价期刊的其他指标 立即指数(Immediacy Index)用某一年中发表文章的被引用次数除以发表文章的总数得到的。立即指数可衡量期刊中“平均论文”被引用的迅速程度。它能告诉你文章发表当年被引用的频率。 被引半衰期(Cited Half-Life)指期刊达到50%被引用率所需的时间。有助于您评估该期刊中文献被引用的时间跨度 施引半衰期(Citing Half-Life)指引文数达到当前期刊发表的论文中的参考文献数的50%所需要的年数。 北京工业大学 2008年 9月

18 如,ISSN1001--8867为《中国图书馆学报》的国际标准编号
正式出版的期刊有ISSN(International Standard Serial Number)代码,ISSN由8位数字组成,分为两段 ,最后一位是计算机校验号。 如,ISSN 为《中国图书馆学报》的国际标准编号 我国正式出版的期刊都有国内统一刊号(CN),它由地区号、报刊登记号和《中图法》分类号组成,如CN /G3。地区号依《中华人民共和国行政区划编码表 GB 》取前两位,如北京为11、天津12、上海31、辽宁21、吉林22等。 北京工业大学 2008年 9月

19 报 纸(newspaper) 报纸是指以新闻为主要内容的连续出版物。就其内容说,报纸大体可分为政治时事性和专业性两种类型。其特点是:出版快,传递及时。阅读面广,是人们工作和生活不可缺少的组成部分。许多情报和情报线索是首先出现于报纸的。因此,报纸也是一种情报源。 CNKI 中“中国重要报纸全文数据库” 可以检索2000年至今的中文报纸信息. “NewsBank 世界各国报纸全文库”可以检索世界上著名报纸信息 北京工业大学 2008年 9月

20 科技报告(Sci-Tech Report):
也称技术报告、研究报告,它是科学研究工作和开发调查工作成果的记录或正式报告 特点:内容新颖、详细、专业性强、出版及时、传递信息快,发行范围控制严格,不易获取原文 识别科技报告的主要依据有:报告名称、报告号、研究机构、完成时间 北京工业大学 2008年 9月

21 美国政府四大报告 一、PB报告:是美国国家技术信息处(NTIS)出版的报告,报道美国政府资助的科研项目成果,内容涉及广泛,几乎包含自然科学与工程技术领域所有学科领域。主要侧重民用工程,如,土木工程,城市规划,环境保护,生物医学等方面。 二、AD报告:是美国国防技术信息中心(DTIC)出版的报告,主要报道美国国防部所属的军事机构与合同单位所完成的科研项目。内容涉及与国防有关的各个领域,如:空间技术、海洋技术、核技术等38类。 三、NASA报告:美国国家航空宇航局出版的报告,内容侧重于航空和空间科学技术领域,广泛涉及空气动力学、飞行器、生物技术、化工、冶金、气象、天体物理、通信技术、激光、材料等。 四、DOE报告:美国能源部出版的报告,报道能源部所属的研究中心、实验室以及合同用户的研究成果。内容包括能源保护、矿物燃料、化学化工、风能、核能、太阳能与低热、环境与安全与地球科学等 北京工业大学 2008年 9月

22 会议文献(conference paper)
是指在各种学术会议上交流的学术论文。 特点:内容新颖、专业性和针对性强,传递信息迅速,能及时反映科学技术中的新发现、新成果、新成就以及学科发展趋向。 识别会议文献的主要依据有:会议名称、会址、会期、主办单位、会议录的出版单位等 会议录(Proceedings)、 会议论文集(Symposium)、 会议论文汇编(Transactions)、 会议丛刊、丛书 北京工业大学 2008年 9月

23 专利文献(Patent Literature):
是实行专利制度的国家,在接受申请和审批发明过程中形成的有关出版物的总称。包括专利说明书、专利公报、专利分类表、专利检索工具以及与相关的法律性文件。 特点: (1)内容新颖、出版迅速 (2)涉及技术领域广泛、实用性强 (3)具有法律效力 中文专利文献检索可以检索”国家知识产权局” DII (Derwent Innovations Index )提供全球专利信息 其他国家和组织如欧洲专利局,美国、日本、德国等国家的专利局也是检索并获取专利全文的重要途径。 北京工业大学 2008年 9月

24 标准文献(Standard Literature):
是经过公认的权威机构批准的以特定的文件形式出现的标准化工作成果。 特点:是对标准化对象描述详细、完整、内容可靠、实用,有法律约束力,适用范围明确,是从事生产、设计、管理、产品检验、商品流通、科学研究的共同依据,也是执行技术政策所必需的工具。 国际标准 ISO 区域标准 国家标准 GB 行业标准 企业标准 基础标准 产品标准 方法标准 安全卫生标准 法定标准 推荐标准 试行标准 北京工业大学 2008年 9月

25 学位论文(Thesis,Dissertation):
高等学校或研究机构的学生为取得某种学位,在导师的指导下撰写并提交的学术论文。 学位论文获取途径: 1中国科技信息研究所是国家法定的学位论文收藏单位 2University Microfilms International--UMI)负责收藏和报道全美的博士、硕士论文,并收集报道其他国家的学位论文 3CNKI和万方数据库都收录国内学位论文 4研究生毕业都要向图书馆或档案馆提交其学位论文 北京工业大学 2008年 9月

26 政府出版物(Government Publication):
是指各国政府部门及其所属机构出版的文献,又称官方出版物。    行政性文献(包括立法、司法文献),主要有政府法令、方针政策、规章制度、决议、指示、统计资料等,主要涉及政治、法律、经济等方面。 科技文献主要是政府部门的研究报告、标准、专利文献、科技政策文件、公开后的科技档案等。 特点:内容范围广泛;具有权威性;一些非正式出版的文献, 不易收集 用途:对了解各国的方针政策、经济状况及科技水平,有较高的参考价值。 北京工业大学 2008年 9月

27 产品资料(Product Literature):
厂商为推销产品而印发的介绍产品情况的文献,包括产品样本、产品说明书、产品目录、厂商介绍等。 特点:反映的技术比较成熟,数据也较为可靠,内容具体、通俗易懂,常附较多的外观照片和结构简图,形象、直观。但产品样本的时 间性强,使用寿命较短,且多不提供详细数据和理论依据。 用途:1、作为技术人员设计、制造新产品的一种有价值的参考资料。 2、了解各厂商出厂产品现状、掌握产品市场情况及发展动向。 北京工业大学 2008年 9月

28 科技档案(Technical Records):
是指在自然科学研究、生产技术等活动中所形成的应当归档保存的科技文件,如课题任务书、计划、大纲、合同、试验记录、研究总结、工艺规程、工程设计图纸、施工记录、交接验收文件等。 特点:内容真实、详尽、具体、准确可靠,保密性强,保存期长久,是科研和生产建设工作的重要依据,具有很大参考价值。 通常保存在各类档案部门 北京工业大学 2008年 9月

29 1.2 文献类型的识别 识别文献类型是获取全文的第一步 请看以下文后参考文献:
1.2 文献类型的识别 识别文献类型是获取全文的第一步 请看以下文后参考文献: 1. Aoki . J,Hatanaka.Y. Appl Phys Lett,2000,76(22):3257—3258. 2. Mixed-type optical fiber current sensor, Proceedings of SPIE, V.1572, p , 1991 3. Weinstein L .Digital Filters and Their Applications. London, England: Academic Press, 1978,p 4. Solar electric generating system IX technical description[ R ].LUZ international >limited: 1990 5. BS EN Thermal solar systems and components — Solar collectors — Part 1 北京工业大学 2008年 9月

30 对文后的参考文献的著录格式作了详细的要求.
1.2 文献类型的识别 GB/T  文后参考文献著录规则 对文后的参考文献的著录格式作了详细的要求. 北京工业大学 2008年 9月

31 图书: 著录格式:主要责任者.书名(版本)[M].出版地:出版社,出版年,页码
  Weinstein L .Digital Filters and Their Applications[M]. London, England: Academic Press, 1978,p 没有文献标识代码的看出版社和出版地 北京工业大学 2008年 9月

32 期刊: 文献标识码:[J]. 主要著录格式:作者.文章题名[J],刊名,年,卷,期:页码
如:邹振扬,郑绎根.纳米TiO2的光化学特性及其在环境科学中的应用[J].工学材料导报,2000,14(6):35-39 Teraoka K,Nonami T,Yokogawa Y,Taoda H and Kameyama T. Preparation of Ti02—coated hydroxyapatite single crystals[J].Journal of Material Research,2000,15(6);1243—1244. Aoki,Hatanaka.Y. Appl Phys Lett [J],2000,76(22):3257—3258. 没有文献标识代码的看刊名信息和卷期信息 北京工业大学 2008年 9月

33 会议文献: 文献标识码:[C] 著录格式: 作者.论文题目[C].会议名称,卷 ,页码, 年
如:Meow D.Mixed-type optical fiber current sensor[C] , Proceedings of SPIE, V.1572, p , 1991 SPIE(International Society for Optical Engineering)国际光学工程师学会 没有文献标识代码的看会议名称 北京工业大学 2008年 9月

34 专利文献: 文献标识码:[P] 著录格式: 专利权人,专利名称,专利号 如: 刘加林.多功能一次性压舌板:中国,92214985.2[P].
没有文献标识代码的看专利号 北京工业大学 2008年 9月

35 学位论文: 没有文献标识代码的看学位授予单位 文献标识码:[D] 主要特征:授予学位的机构名称、地点及授予年份等
CALMS R B. Infrared spectroscopic studies on solid oxygen[D]. Berkeley; Univ. of Califor-nia 没有文献标识代码的看学位授予单位 北京工业大学 2008年 9月

36 常用文献类型代码 B C D G J K M N P R S 档案 会议录 学位论文 汇编(含论文集等) 期刊 专著(含教材等) 报纸
单字码 名称 B 档案 C 会议录 D 学位论文 G 汇编(含论文集等) J 期刊 K 参考工具(含年鉴,手册,字典等) M 专著(含教材等) N 报纸 P 专利文献 R 科技报告(含技术,调查,考察等) S 技术标准(含规范,法规等) 北京工业大学 2008年 9月

37 电子文献载体和标志代码 载体类型 标志代码 磁带(magnetic tape) MT 磁盘(disk) DK 光盘(CD-ROM) CD
联机网络(online) OL

38 二、文献检索 一、文献检索的概念与原理 二、检索语言 三、检索工具 北京工业大学 2008年 9月

39 信息检索与文献检索是两个不同的概念,文献检索是信息检索的一种最基本的、最主要的形式。
2.1 文献检索的概念与原理 一、文献检索的基本概念 信息检索与文献检索是两个不同的概念,文献检索是信息检索的一种最基本的、最主要的形式。 信息检索: 广义:将信息按照一定的方式组织和存储起来,并根据用户的需求 找出有关信息的过程。 狭义:指用户找出有关信息的过程。 北京工业大学 2008年 9月

40 信息检索的类型(根据不同的检索对象): 一、数据检索:检索的结果是数据。如某种材料的电阻;某变压器的参数;化学分子式、数据图表等(手册), 某地方GDP增长情况(年鉴) 二、事实检索:检索的结果是事实结论。查询某一事物(事件)的性质、定义、原理以及发生的时间、地点过程等。如某产品是哪个厂家生产,哪个牌子的最好;第一颗人造卫星是什么时候升空的(年鉴) 三、文献检索:检索的结果是文献资料。查找相关文献的内容、出处、收藏单位等。如系统地查找水压伺服控制阀原理方面的相关文献(论文) 北京工业大学 2008年 9月

41 2.2 检索语言 检索语言是应文献信息的加工、存储和检索的共同需要而编制的专门语言,是表达一系列概括文献信息内容和检索课题内容的概念及其相互关系的一种概念标识系统。 检索语言按规范化程度划分:自然语言和受控语言 按照描述文献内容特征划分:分类语言和主题语言 北京工业大学 2008年 9月

42 检索语言的主要作用: ①标引文献信息内容及其外表特征,保证不同标引人员表征文献的一致性;
②对内容相同及相关的文献信息加以集中或揭示其相关性; ③使文献信息的存储集中化、系统化、组织化,便于检索者按照一定的排列次序进行有序化检索; ④便于将标引用语和检索用语进行相符性比较,保证不同检索人员表述相同文献内容的一致性,以及检索人员与标引人员对相同文献内容表述的一致性; ⑤保证检索者按不同需要检索文献时,都能获得最高查全率和查准率。 北京工业大学 2008年 9月

43 自然语言:信息检索系统中使用的标引词直接来自文献和用户提问而不加控制的一类检索语言,主要有关键词语言。
自然语言的应用以计算机为前提,否则,自然语言检索将难以实现 受控语言:标引词来自文献或者用户,并受到信息检索系统的控制的一类检索语言的总称,又叫规范化语言,主要包括分类语言和主题语言。 北京工业大学 2008年 9月

44 分类检索语言是用分类号来表达各种概念的,并将各种概念按学科性质进行分类和系统排列。
目前,国内外常用的分类法《中国图书馆分类法》(中图法)、《中国科学院图书分类法》(科图法)、《美国国会图书馆图书分类法》(LC)等都是以体系分类法为主。 主题检索语言是用词语来表达各种概念的,并将各种概念按字顺排列。 主题检索语言包括标题词语言、单元词语言、叙词语言和关键词语言(各自的概念从略) 北京工业大学 2008年 9月

45 文献分类法与主题法比较   1 分类法:按照文献资料的学科属性   分类法的特征在于知识的系统性,不仅揭示图书的学科知识内容,而且把有关同一学科内容的文献资料集中在一起,使学科临近的文献排在相近的位置,根据各类图书之间的亲疏关系将藏书组织成一个系统.   2 主题法:按照所论述的事物   将文献所论述的事物按照规范化的语言(主题词)的字顺进行排检,从本质上讲,是用词语来揭示文献所阐释或研究的对象、事物和问题。与分类法相比,从不同角度来揭示文献。 北京工业大学 2008年 9月

46 分类法 世界上有代表性的分类法: 1 《杜威十进制分类法》(Dewey Decimal Classification and Relative Index 简称DDC) 2 《国际十进制法》(Universal Decimal Classification,简称UDC)(被广泛应用于科学论文的分类 ) 3 《美国国会图书馆图书分类法》(Library of Congress Classification,简称《国会法》或LC)(目前广泛应用于北美大中型图书馆,特别是大学等学术性图书馆 ) 4 《中国图书馆分类法》 北京工业大学 2008年 9月

47 《中图法》介绍 《中图法》——《中国图书馆分类法》,以学科来组织知识,将全部知识领域划分为5个基本部类,22大类。 五大部类分别为:
马列主义、毛泽东思想; 哲学;社会科学; 自然科学; 工程技术 综合性图书。 北京工业大学 2008年 9月

48 22大类分别为: A 马列主义 .列宁主义.毛泽东思想.邓小平理论; B 哲学.宗教
C 社会科学总论; D 政治、法律; E 军事; F 经济 G 文化、科学、体育、教育; H 语言、文字; I 文学 J艺术;K 历史、地理;N 自然科学总论;O 数理科学和化学 P 天文学、地球科学;Q 生物科学;R 医药、卫生;S 农业科学 T工业技术;U 交通运输;V 航空、航天;X 环境科学.安全 科学;Z 综合性图书 北京工业大学 2008年 9月

49 T类又可分为以下几类 TB 一般工业技术 TD 矿业技术 TE 石油、天然气工业 TF 冶金工业
TG 金属学、金属工艺 TH 机械、仪表工艺 TJ 武器工业 TK 动力工程 TL 原子能技术 TM 电工技术 TN 无线电电子学,电信技术 TP 自动化技术,计算机技术 TQ 化学工业 TS 轻工业、手工业 TU 建筑科学 TV 水利工程 北京工业大学 2008年 9月

50 《中图法》从大类到小类,层层展开,不断细分,形成完整的知识体系。
例如: 关于红楼梦研究资料的分类为 I I 文学 I2 中国文学 I207 文学评论和研究 I 小说研究 I 古代小说研究 I 《红楼梦》研究与评论 北京工业大学 2008年 9月

51 有关互联网的知识分类为TP393.4 T 工业技术 TP 自动化技术 计算机技术 TP3 计算机技术 TP39 计算机的应用
北京工业大学 2008年 9月

52 汉语主题词表 《汉语主题词表》是我国第一部大型综合性主题词表。1979年出版,自然科学部分1991年修订.收录正式主题词91158条,非正式主题词17410条。全表共分3卷10分册,由主表、词族索引、范畴索引、英汉对照索引等组成。是我国应用最广的一部主题标引和检索的工具。其款目(条目)格式如下:(下一页)

53 主题词汉语拼音━━━> Xianxiangguan
主题词━━━> 显像管       [E56] <━━━范畴号 主题词英译名━━━> kinescope             Picture tube Y 显像管 D 电视显像管              监视管             F 彩色显像管              固体显像管              黑白显像管             S 电子束管             Z 电子管             C 显示管              指示管 注释: Y 用项符号:表示该主题是正式主题词 D 代项符号:表示该主题是非正式主题词 F 分项符号:表示该主题是“显像管”的分主题词,即下位词 S 属项符号:表示该主题是“显像管”的上位主题词 Z 族项符号:表示该主题是“显像管”的族首词(大主题词) C 参项符号:表示该主题是“显像管”的相关主题词

54 词表在文献检索中的作用 2.明确上下位概念,逐级展开相关叙词的等级关系 3.词表是了解课题专业技术背景的科学依据;
1.词表是主题法检索中确定规范词的主要依据; 2.明确上下位概念,逐级展开相关叙词的等级关系 3.词表是了解课题专业技术背景的科学依据; 4.词表是选择检索英文关键词的重要工具; 北京工业大学 2008年 9月

55 例如: Y 废水处理 D 污水处理 F 生物处理, 化学处理 深度处理, 污泥处理 S 水处理 Z 废物处理 C 混凝沉淀
深度处理, 污泥处理   S 水处理   Z 废物处理   C 混凝沉淀 北京工业大学 2008年 9月

56 2.3 检索工具 定义:是人们用来存储、报道和查找文献的工具。因此它具有存储和检索的功能 特点: 1.详细地著录了文献的外部特征和内容特征
2.具有既定的检索标识,如主题词、分类号、作者姓名等 3.全部文献根据标识系统地科学地排列,成为一个有机的整体 4.提供多种检索途径 北京工业大学 2008年 9月

57 检索工具的职能 1 存贮职能:管理文献,使大量毫无规律、分散的一次文献成为有序的集合体(文献库)。即把所有有关文献的外部特征记录下来,并按规定的格式把这些特征组成一条条文献线索,然后选择某一特征项(例如著者、分类号、主题词等)等作为标识,将这些线索有系统地排列起来,形成一个有机的整体。 2 检索职能:即利用检索工具检索文献。 3 报道和浏览职能:检索工具以简洁的文字报道大量的文献,并能揭示文献的外表特征和内容特征,使人们花费较少的时间和精力就能了解到某一时间、某一专业学科发展的水平、成就,从而分析该学科或研究领域的发展趋势。 北京工业大学 2008年 9月

58 检索工具的类型 按载体划分 手工(印刷版) 电子型(网络;光盘) 按内容(或著录方式)划分:
(1)目录型检索工具;著录对象是整本书或某种期刊 (2)题录型检索工具;著录对象是单篇文章 (3)文摘型检索工具;著录对象是单篇文章 (4)索引型检索工具。著录对象是知识单元 北京工业大学 2008年 9月

59 目录型检索工具 目录的著录对象一般是整本书或整种刊物 《全国总书目》揭示每年国内图书出版情况
目录是图书、期刊等出版物外表特征的揭示和报道。它以完整的出版物(如一本书、一种期刊)作为著录的基本单位,所以也可以说它是按某种顺序编排的文献清单。是指导阅读和科学管理文献的重要手段。 目录的著录对象一般是整本书或整种刊物 《全国总书目》揭示每年国内图书出版情况 每个图书馆的OPAC(在线公共目录)揭示该馆的管藏 联合目录揭示许多家图书馆出版物收藏情况。 北京工业大学 2008年 9月

60 题录型检索工具 题录的著录对象一般是单篇文献。 以单篇文献为报道单元的印刷版的检索工具往往是题录型的,比如《全国报刊索引》
题录是描述文献外部特征的文献条目。文献的外部特征包括题名、著者、出处、卷期、页码、时间、文献类型、语种等著录项目。 题录的著录对象一般是单篇文献。 以单篇文献为报道单元的印刷版的检索工具往往是题录型的,比如《全国报刊索引》 北京工业大学 2008年 9月

61 文摘型检索工具 除题录部分外还对文献内容作实质性描述 作用:
1.对文摘的阅读,在一定程度上起到代替原文作用.科技人员阅谈了著录较为详细的文摘之后,大体上就掌握了原文内容要点,不必再阅读原文了。这一点,对于那些难索取到原文的“难得文献”尤为重要,也大大节省了科技人员查找和阅读文献的时间 2.确定相关性,即帮助读者判断所检索到的文献是否合乎需要,从而决定原始文献的取舍. 3.帮助读者克服语言上的障碍,因为在一种检索工具中,无论原始文献是什么语种,其文摘都被译为统一的一种语言(一般为英语). 北京工业大学 2008年 9月

62 索引型检索工具 索引是将图书、期刊等文献中的一些重要的、有检索价值的知识单元(如:如主题、著者、地名、分子式、号码等)根据需要一一分析摘录出来,并注明它们所在文献的页码和文献号,再按一定的顺序编排组织起来,构成检索的种种途径。这种检索工具称之为索引。 索引在文献检索领域有广泛的应用,不同的标目系统构成不同的索引,例如,按照文献外部特征编制的刊名索引、篇名索引、著者索引、引文索引等,按照文献内容特征编制的分类索引、主题索引。 索引的作用:    ①为查找特定的文献或事实提供多种检索途径; ②揭示事物之间的联系; ③揭示出容易被人们忽略的内容; ④为读者了解某一学科或领域的全面文献信息提供了捷径; 北京工业大学 2008年 9月

63 三 计算机检索 一、相关概念 二、计算机检索技术 三、课题分析 三、数据库中的各种检索方式 四、数字资源中的新概念
三 计算机检索 一、相关概念 二、计算机检索技术 三、课题分析 三、数据库中的各种检索方式 四、数字资源中的新概念 北京工业大学 2008年 9月

64 3.1 相关概念 字段(field):如在数据库中题名、作者、作者单位、期刊名、摘要、全文等等均是字段;一条记录由多个字段值组成;对计算机检索来说字段相当于检索入口。 记录(Record):由若干字段组成的文献单元,在全文数据库中,一条记录相当于一篇完整的文献,在书目数据库中,一条记录相当于一条文摘或题录。 文档(File): 由若干个逻辑记录构成的信息集合,是数据库的基本内容,分为顺排文档和倒排文档。顺排文挡是数据库的主体内容,倒排文档是将记录中的一切可检字段或属性值提取出来,按某种顺序重新加以组织所得到的文档。    顺排文档(记录)    倒排文档(索引) 数据库(database)――由计算机进行处理的一定数量同类信息的有序集合,是用来存储和查找文献信息的电子化检索工具。 北京工业大学 2008年 9月

65 SO——Source 文章来源(刊名信息等)
常用字段缩写: TI——Title 文章题目 AB——Abstract 文章摘要 KW——Key Word 关键词 AU——Author 作者 AF——Affiliation 作者单位 SO——Source 文章来源(刊名信息等) ISSN(ISBN)—— International standard Serial (book) Number PY——Publication year 出版年 LA——Language 语种 PT——Publication type 文章类型 北京工业大学 2008年 9月

66 3.2 计算机检索技术 布尔检索 截词检索 限制检索 位置检索 词组检索 禁用词 查准率 查全率 扩大检索范围 缩小检索范围
布尔检索 截词检索 限制检索 位置检索 词组检索 禁用词 查准率 查全率 扩大检索范围 缩小检索范围 北京工业大学 2008年 9月

67 布尔检索 2.逻辑“或”(OR),表示为 A or B 或 A + B 3.逻辑“非”(NOT),表示为 A not B 或 A - B
1.逻辑“与” (AND),表示为 A and B 或 A * B 2.逻辑“或”(OR),表示为 A or B 或 A + B 3.逻辑“非”(NOT),表示为 A not B 或 A - B 注:英文数据库通常用字母,中文数据库要用符号 北京工业大学 2008年 9月

68 布尔检索 逻辑“与” (AND) 表示检出的记录必须同时包含所有的检索词,可以缩小检索范围,减少命中文献量,提高查准率。 逻辑“或”(OR)
表示检出的记录中至少含有多个检索词中的任何一个, 可以扩大检索范围,增加命中文献量,防止漏检。常用于连接同义词,相关词等。 逻辑“非”(NOT) 表示检索结果中排除含有某些词的记录,可以缩小检索范围,减少文献输出量,但并不一定能提高查准率。 北京工业大学 2008年 9月

69 截词检索 截词符(通配符)——提高查全率,防止漏检的有力手段,也可以简化输入。 包括有限截词和无限截词,常用的截词符有:*, #,?,!,$
有限截词——放在词中间或末尾,一个符号表示一个字符 比如: wom*n 可检索出:woman,women(中间截断) chip? 可检索出:chips(右截断) 无限截词——放在词干的末尾,一个符号表示任意多个字符 比如:comput! 可检出:compute, Computer,computers,computing, Computerize, 等. 注:不同的数据库所用的截词符不一样,使用应先查一下各数据库的帮助加以确认 北京工业大学 2008年 9月

70 位置算符 常用的位置算符有W/n(adj/n), N/n( Near/n)
也叫”邻接检索”, 表示两个或多个检索词之间的关系检索方式 常用的位置算符有W/n(adj/n), N/n( Near/n) W/n(adj/n)表示两个检索词不可以互换顺序,二者之间可以插入0-n个词. 例如:输入communication( W/2)satellite系统将会检出communication satellite; communication though satellite; communication on the satellite. N/n( Near/n)表示两个检索词可以互换顺序,二者之间可以插入0-n个词 例如: communication( N/2)satellite,不仅会检出以上记录,而且还会检出satellite communication 等 北京工业大学 2008年 9月

71 限制检索 字段检索——利用字段进行限制,如题名、摘要、全文等 通常的字段限制范围的大小顺序是: 题名<关键词<摘要<全文
泛指检索系统中提供的缩小或约束检索结果的检索方法。主要有以下方式: 字段检索——利用字段进行限制,如题名、摘要、全文等 通常的字段限制范围的大小顺序是: 题名<关键词<摘要<全文 二次检索——在前一次检索的结果中进行另一概念的检索 北京工业大学 2008年 9月

72 词组检索 两个或多个词不能拆开,不能互换位置,中间不能插入任何字符 通常用“”或()来表示
如:hypermedia database 表示pypermedia AND database 而“hypermedia database”则表示一个词组 北京工业大学 2008年 9月

73 禁用词 英语或汉语中都有许多虚词,不能作为检索词。 如:汉语中“的、地、得、了”等助词
英语中的a about also and any as at be between by both for some so not this with等介词或冠词等 北京工业大学 2008年 9月

74 扩大检索范围,提高查全率的方法 查全率: (Recall Ratio) 指系统在实施某一检索作 业时,检出相关文献的能力,用公式表示为: R=检出的相关文献量/系统数据库中的相关文献总量 扩大检索范围,提高查全率的方法 1、考虑同义词或近义词(使用布尔逻辑符or连接) 2、选择较大检索范围的字段如摘要 3、使用截词符 4、使用上位词(如飞行器 ____航天飞机____ 载人航天飞机) 北京工业大学 2008年 9月

75 缩小检索范围,提高查准率的方法 查准率: (Precision Ratio)指系统在实施某一检索作业时,拒绝不相关文献的能力。用公式表示为:P=检出的相关文献量/检出文献总量 缩小检索范围,提高查准率的方法 1、使用and 、not等限制检索范围 2、使用位置算符 3、选择检索范围较小的字段 4、使用二次检索 5、使用下位词 6、使用精确检索,如对于固定短语来说可用“”引起来 北京工业大学 2008年 9月

76 检索策略 检索策略在计算机检索中直接决定检索结果的准与全。 具体步骤: 1 分析课题,确定检索词和检索词之间的关系,并组配检索式
检索策略是对检索的全面策划,在操作上主要指数据库的选择和检索式的编制。 检索策略在计算机检索中直接决定检索结果的准与全。 具体步骤: 1 分析课题,确定检索词和检索词之间的关系,并组配检索式 2 明确检索要求,选择数据库 3 实检和反馈调节 北京工业大学 2008年 9月

77 三 分析课题——确定检索词和检索词之间的关系
1 课题涉及的概念分析 2 关键词的提取与扩展 例如: 神经网络在旋转机械故障诊断中的应用研究   1.本课题包含“神经网络” “旋转机械” “故障诊断”三个概念,“应用”和“研究”属于意义过于宽泛的词,不应该作为检索词。 2.扩展 神经网络:相关的上位词有人工智能    旋转机械    故障诊断:相关词有故障定位、故障检测,上位词有容错技术 3.检索式: (神经网络OR人工智能)AND(旋转机械)AND (故障诊断OR故障定位OR故障检测OR容错技术) 北京工业大学 2008年 9月

78 例2: “人工智能技术在计算机辅助教学中的应用与实现” 分析:本课题可确定为两个概念 人工智能 计算机辅助设计 人工智能:同义词:智能模拟
   人工智能    计算机辅助设计    人工智能:同义词:智能模拟      下位概念:模式识别 自然语言理解与生成 专家系统                         自动程序设计  数据智能检索    计算机辅助教学系统(computer Aided Instruction ,CAD ) 检索式 (人工智能OR智能模拟OR模式识别OR自然语言理解与生成OR专家系统OR自动程序设计)AND(计算机辅助设计OR CAD) 北京工业大学 2008年 9月

79 分析课题时须注意的问题 1.要从概念入手,而不是从字面意思入手;
  1.要从概念入手,而不是从字面意思入手; 2. 概念扩展时要考虑同义词,相关词,上位词/下位词等,(既词表中提到的用、代、分、属、参、族。还要注意中英文混用的现象 ;   3.当课题比较生疏时,应当首先利用百科全书、图书等弄清楚概念,了解课题的有关专业知识,弄清楚课 题的内容和要解决的问题以及解决该问题的初步设想等,进而确定检索的主题范围。 4 人文社会科学的检索,如果是回溯检索,应该熟悉不同年代所使用的概念和术语 5 忽略那些意义过于宽泛,通用的词,比如:“研究” 、“应用” “探讨”等。还要忽略禁用词。 北京工业大学 2008年 9月

80 明确检索要求,选择数据库 选择数据库要考虑以下因素: 1.检索目的:检索的时间范围、文献类型、检索深度为题录、文摘还是全文等等
2.检索结果: 对于研究生做学位论文来说,做课题前应充分了解一下本课题国内外的研究现状(即论文的综述部分),这时应对该课题进行较全面的检索,包括综述性的文章,要求全面;对于该课题的核心部分,即该课题所要解决的具体问题,创新的地方,则需要准,技术细节越 细越好。 3.检索内容所属学科,对与自己相关的数据库要有一个全面的了解. 北京工业大学 2008年 9月

81 四、数据库中的各种检索方式 分类浏览 Category browse 简单检索 Simple search, Basic search
高级检索 advanced search 专家检索 Expert search 北京工业大学 2008年 9月

82 各种检索方式有缺点比较 常用的检索方法 优点 缺点 基本检索(简单检索) 只有一个检索框,大部分数据库可使用各种运算符
约束条件少,不能准确地表达检索用户的检索意愿,对有的数据库来说需要掌握一定的检索的指令 高级检索(推荐) 提供多个检索框,以及多种约束条件,基本能够表达用户的检索意愿;不需要构造复杂的检索式,一般只提供检索词即可,简单灵活 有的数据库不允许在检索框中使用运算符 专家检索 只有一个检索框,可随意书写合法的检索表达式,比较灵活 需要掌握一定的检索指令,指令的书写容易出错 北京工业大学 2008年 9月

83 四、 数字资源中的新概念 1 什么是DOI   DOI是“Digital Object Identifier”的简写,用来标识在数字环境中的内容对象。每一个DOI对应一个URL。 DOI可以用来揭示有关该数字对象的一些信息,包括从INTERNET哪里可以找到它。随着时间推移,数字对象的某些有关信息可能会有变化(包括从哪里可以找到它),但是DOI不会改变。DOI是一个永久性的标识号,由International DOI Foundation管理。 一篇文章在期刊网站的网址有可能发生变化,但是,它在DOI系统中的网址却永远不会改变,而且,通过DOI系统的自动转换后,将永远指向最新有效的期刊网站网址。 北京工业大学 2008年 9月

84 如何根据DOI号找到原始文献信息?      1 登陆 A DOI Name”的提示框内输入已知DOI, 点击“Go”按钮,DOI系统就会自动链接到该文献的url,并显示相应的页面。 另外也可以直接在IE地址栏里输入     例:已知某文献的DOI: “ /s ”则可以在IE地址栏里输入:  此外,CrossRef网站也提供了通过DOI查找URL的功能: Resolver"输入提示框中输入已知DOI,"submit"即可。 北京工业大学 2008年 9月

85 2 CrossRef 于1999 年11 月由世界著名的12 个商业和非商业出版商发起并宣布成立非盈利组织PILA(Publishers International Linking Association),此后成员越来越多,“CrossRef 以Digital Object Identifier (DOI) 为核心技术,借助该技术, 用户通过电子杂志的引文, 能够连接与该引文相符的电子论文的全文 CrossRef目前仅限于学术期刊,原因是学术期刊有相互连结的需要,而且本身制作也较别的领域更有规律,所以作起来比较容易。但这一机制实际上不限于学术期刊,任何网上对象应都适用。 北京工业大学 2008年 9月

86 3 什么是SFX 扩展服务 SFX(Special Effects的缩写),是新的网络电子资源无缝链接整合软件系统,也可以称为上下文敏感参考文献链接解决方案。SFX可以把不 同来源和不同通信协议的信息完全融合,使不同类型、不同格式的数 字资源实现无缝链接,其技术为机构提供特制的连接,实现在异构的 分布式信息系统之间无阻碍导航。它允许用户在数据库中点击一篇文 章的记录,然后显示所有能够得到的与这篇文章相关的服务选项列表 北京工业大学 2008年 9月

87 4 什么是RSS RSS 是一种用于共享网页( WEB )内容的数据交换格式,一种由网站直接把信息送到用户桌面的技术,用户可以通过RSS阅读器订阅自己感兴趣的内容,当网站内容更新时,用户会看到新信息的标题和摘要,并可以阅读全文。RSS是Rich Site Summary(丰富站点摘要)或Really Simple Syndication(简易信息聚合)的简称 北京工业大学 2008年 9月

88 5 Alert 提醒的意思 。数据库中的Alert服务需要用户注册,注册以后提交自己的检索要求(检索式)。然后数据库中添加了满足自己检索需求的数据以后,系统就会将满足你检索需求的信息发送到你的邮箱,或者出现在数据库个性化的栏目里。 北京工业大学 2008年 9月

89 6 Tag(分众分类) 在网络上,你看到一条信息,一篇文献,你给它作个标记,取个名字,比如:综述,纳米等等,同样的文章,别人也会给它取不同的名字,不同的文章,不同的人会取相同的名字。Tags就将同一文章的不同或相同的名字汇集起来,以便用户查看统一名称下的其他文章。 北京工业大学 2008年 9月

90 北京工业大学 2008年 9月


Download ppt "科技信息检索与利用 北京工业大学图书馆 信息咨询部 刘彩娥 2008.9."

Similar presentations


Ads by Google