Presentation is loading. Please wait.

Presentation is loading. Please wait.

计算机检索基本知识 贾芳华 fhwaj@163.com fhwaj@qtech.edu.cn QQ:149552480 青岛理工大学图书馆信息部 0532-85071729 青岛理工大学图书馆 2017/2/28.

Similar presentations


Presentation on theme: "计算机检索基本知识 贾芳华 fhwaj@163.com fhwaj@qtech.edu.cn QQ:149552480 青岛理工大学图书馆信息部 0532-85071729 青岛理工大学图书馆 2017/2/28."— Presentation transcript:

1 计算机检索基本知识 贾芳华 fhwaj@163.com fhwaj@qtech.edu.cn QQ:149552480
青岛理工大学图书馆信息部 青岛理工大学图书馆 2017/2/28

2 主要内容 计算机检索的基本概念 常用计算机检索技术 检索途径与检索语言 检索的一般程序和策略 青岛理工大学图书馆 2017/2/28

3 第一节 计算机检索的基本概念 可分单机检索、联机检索和网络检索三大类。 青岛理工大学图书馆 2017/2/28

4 第二节 常用计算机检索技术 二、计算机检索技术 常见文本检索技术包括: 布尔逻辑检索 字段检索 位置算符检索 加权检索 截词检索 短语检索等
青岛理工大学图书馆 2017/2/28

5 布尔逻辑检索 利用布尔逻辑算符将一些具有简单的、表达某一主题概念的检索单元(或检索标识)组配成一个具有复杂概念的检索式,以满足课题检索的要求。 常见的布尔逻辑算符主要有三种: 逻辑与——AND(*) 逻辑或——OR(+) 逻辑非——NOT(-) 青岛理工大学图书馆 2017/2/28

6 检出的结果中只需满足检索项中的任何一个或同时满足即可 并列关系 组配相同概念的检索词,如同义词、近义词等。扩大检索范围,提高查全率
逻辑算符 含义 表示关系 作用及表达 “与”(AND 或*) 检索出的记录必须同时含有所有的检索词 概念交叉和限定 缩小检索范围,提高查准率 A and B或A*B “或”(OR或+) 检出的结果中只需满足检索项中的任何一个或同时满足即可 并列关系 组配相同概念的检索词,如同义词、近义词等。扩大检索范围,提高查全率 A or B或A+B “非”(NOT或-) 检出的记录中只能含有NOT算符前的检索词,不能同时含有其后的检索词 概念删除关系 缩小检索范围,提高检索的专指度 A not B或A–B 青岛理工大学图书馆 2017/2/28

7 逻辑算符举例 查找关于“动物保护”的文献:
“动物”和“保护” 可以用“逻辑与”组配,表示为“动物 AND 保护”,检出记录中既涉及动物又涉及保护的相关文献。 查找有关冬虫夏草的文献: 冬虫夏草又称冬虫草、虫草 ,“冬虫夏草”、“冬虫草”、“虫草 ”三者要用逻辑或组配,表示为“冬虫夏草 or 冬虫草 or 虫草”,检索出文献中包含三者任意一种即被检出。 查找关于国外建筑特色的文章: 国外即不包括中国 ,建筑和中国之间为逻辑非的关系,表示为“建筑 not 中国”,检索结果排除了中国建筑的相关文献。 检索西红柿种植技术的相关文章: 西红柿” 又称“番茄”,表示为“西红柿+番茄”;“种植”的同义词有“栽培”、“培育”,表示为“种植+栽培+培育”;检索表达式为:(西红柿+番茄)*(种植+栽培+培育) 青岛理工大学图书馆 2017/2/28

8 项目名称:耐高温粘接剂研究 维普: (题名=高温*粘接剂) 9篇
维普: (题名=高温*粘接剂) 篇 维普: (题名=高温*(粘接剂+胶粘剂+粘合剂+粘结剂+黏合剂+胶黏剂+粘固剂+胶结剂)) 篇 运算优先级顺序为NOT、AND、OR,可以用括号“( )”改变它们的运算顺序。 如A and (B or C),检索顺序为先B或C,然后再与A 青岛理工大学图书馆 2017/2/28

9 Questions 在某数据库中,用A检索得到100条结果,用B检索得到70条结果,那么:
1.【A AND B】最多有 _ 条结果,最少有 _ 条结果; 2.【A OR B】最多有 __ 条结果,最少有 _ 条结果; 3.【A NOT B】最多有 _ 条结果,最少有 _ 条结果。 青岛理工大学图书馆 2017/2/28

10 字段检索 是限定检索词在资源记录中出现的字段范围的一种检索方法, 例如VIP中 T=限定检索词出现在题名中
K= 限定检索词出现在关键词字段中 青岛理工大学图书馆 2017/2/28

11 字段限制检索使用方法:先键入字段代码,然后输入检索式,如“TI information W2 management”。
EBSCO中主要字段代码: 作者-AU 文章题名-TI 全文—TX 文摘-AB 关键词(作者给出)—KW 主题-SU 刊名—SO 国际统一刊号-IS 图像-FM 字段限制检索使用方法:先键入字段代码,然后输入检索式,如“TI information W2 management”。 作者的输入方式特别规定为“姓,名”格式,如“AU Wiley, Ralph”。 青岛理工大学图书馆 2017/2/28

12 位置算符检索 位置检索是通过对各个检索词在检索结果中出现的相对位置进行限定的一种检索方法。按照对各检索词之间应该满足的位置关系要求的不同,可以有多种不同类型的位置检索,例如邻近检索、同句检索、同字段检索等。 例如(CNKI中) 1、检索在摘要的一句中顺序包含“遗传学”、“农业”,并且间隔小于2个词的期刊文章。 检索式:摘要=‘遗传学 /PREV 2 农业’ 2、查找王维的一首诗,诗中包含“晚来秋、清泉石上流”,要求查找全诗及诗名。 检索式:全文='晚来秋 /SEN 2 清泉石上流' (同段,在两句之内按词序出现) 青岛理工大学图书馆 2017/2/28

13 加权检索 该法是从量的角度对检索词加以限制和表述,其侧重点不在于判定检索词或字符串与别的检索词或字符串是什么关系,而在于判定检索词或字符串在满足检索逻辑后对文献命中与否的影响程度。它强调的是检索词之与命中文献(或课题)的相关程度和重要程度。 例如CNKI中 =‘str $ N’ 设定检索词出现的次数 青岛理工大学图书馆 2017/2/28

14 截词检索 又称部分一致检索,是在检索词的适当位置进行截断,然后使用截词符代替,利用截断的词的一部分进行检索。它利用某些检索词的词干或不完整词形加上截词符,以表达概念的完整意义进行检索。其实质是利用计算机特有的指定位对比判断功能进行检索词与索引词之间的对比匹配。可有效处理具有同一词干的检索词,名词的单复数、动词不同形式,英美不同拼写等,有助于提高查全率 青岛理工大学图书馆 2017/2/28

15 有限后截断 acid?? 可将acid, acids, acidic纳入检索范围
例如 无限后截断 physic* 可将physic, physical, physician, physicist, physicists纳入检索范围 有限后截断 acid?? 可将acid, acids, acidic纳入检索范围 前截词  *computer 将检索出 computer、 minicomputer 、 microcomputer等单词的文献。 中截断(屏蔽检索) colo?r 可将colour, color纳入检索范围 propell?nt? 可将propellant,propellants,propellent,propellents纳入检索范围 青岛理工大学图书馆 2017/2/28

16 短语检索 短语检索是使用专门的运算符号把多个检索词汇组织成特定的短语,完成检索任务。是一种固定词组检索。一般使用“"(英文半角)。例如使用“联想电脑”作为入口词,其检索效果就比使用“联想产品*电脑”好,更比使用“联想*电脑”的字面组配形式好的多。 很多通信类专业术语的缩略语中间都带有“-”符号(如B-ISDN,MPEG-2,MPEG-4,MPEG-7等),使用这些缩略语检索的时候通常有两种处理方法:一是用逻辑“与”(*);二是要用上下引号(“”)把词语引起来作为一个整体(短语)检索。否则检索结果就会有很大的出入。 青岛理工大学图书馆 2017/2/28

17 除以上几种主要的检索技术与方法外,文本信息还有一些辅助性的检索技术与方法: 检索结果的排序输出。 导航与浏览 检索结果的可视化
检索结果的翻译 区分大小写检索 繁简体汉字转换 中英文混合检索 青岛理工大学图书馆 2017/2/28

18 第二节 检索途径与检索语言 检索系统的组织方式不同,其提供的检索途径也不同。检索途径根据其入口词(或索引类型)的不同,一般可分为以下几种途径:分类途径、主题途径、著者途径(个人著者和团体著者)、引文途径、代码途径。 青岛理工大学图书馆 2017/2/28

19 常用五类检索途径 分类途径:以分类号作为检索入口词。 主题途径:以主题词作为检索入口词。 著者途径:以著者名称作为检索入口词。
引文途径:以已有的相关文献后所附参考文献(引文)为线索。 代码途径:以某些特殊的代码和符号作为检索入口词。 在上述五种检索途径中,分类途径和主题途径是检索实践中所使用的主要途径。而分类途径和主题途径是建立在相应的检索语言(分类语言和主题语言)基础上的。 青岛理工大学图书馆 2017/2/28

20 检索语言——建立和使用信息检索系统时,用来表征文献特征或课题概念的一种专门的人工语言。一般都有相应的检索语言词表。
检索语言就好比是检索用户与检索系统之间的双语种词典,是沟通二者之间的桥梁。 青岛理工大学图书馆 2017/2/28

21 检索语言类型 检索 语言 描述文献 外表特征 篇名(书名、刊名等) 著者(个人、团体著者) 号码(标准号、专利号文献索取号)
文献类型(论文、书评) 内容特征 分类语言 主题语言 标题词 单元词 叙词 关键词 检索语言类型 青岛理工大学图书馆 2017/2/28

22 分类检索途径——分类语言 检索工具或检索系统是通过按某种特定的分类法组织文献信息提供分类检索途径的。按某种分类法组织的正文或分类索引提供了相应的分类检索途径。使用分类检索途径进行检索,首先必须根据待检课题内容,依据所用检索工具或检索系统所使用的分类词表进行标引,确定本课题在该分类表中的类目和类号,然后使用引得的类号(标引后的类号)通过分类索引或直接从按分类组织的正文进行检索,查出有关文献信息。 青岛理工大学图书馆 2017/2/28

23 常见分类表 国内: 中图法 1975 资料法 1975 科图法 1958 国外:
中图法 1975 资料法 1975 科图法 1958 国外: 美国国会图书馆分类法(Library of Congress Classification—LCC) 国际十进分类法(Universal Decimal Classification—UDC) 国际专利分类法(International Patent Classification—IPC) 杜威十进分类法(美国 杜威)等等。 青岛理工大学图书馆 2017/2/28

24 《中图法》简介 类目结构 按科学知识本身的门类结构进行划分。分为五大类,二十二个基本大类。(见下页) 标记符号(分类号)
采用拼音字母与阿拉伯数字相结合的混合编码制除T大类外的其它二十一个基本大类均以一个字母(第一大类)加多位数字(二级以后类目)的形式,T大类下的二级类目为双字母,三级以后类目在两位字母后加数字。 青岛理工大学图书馆 2017/2/28

25 《中图法》基本大类 五大部类,二十二基本大类: 马克思主义、列宁主义、毛泽东思想、邓小平理论 A马克思主义、列宁主义、毛泽东思想、邓小平理论
哲学、宗教 ·························B 哲学、宗教 社会科学····························C 社会科学总论 D 政治、法律 E 军事 F 经济 G 文化、科学、教育、体育 H 语言、文字 I 文学 J 艺术 K历史、地理 自然科学····························N自然科学总论 O数理科学和化学 P天文学、地球科学 Q生物科学 R医药、卫生 S农业科学 T工业技术 U交通运输 V航空航天 X环境科学、安全科学 综合性图书··························Z综合性图书 青岛理工大学图书馆 2017/2/28

26 T 工 业 技 术 TB 一般工业技术 TD 矿业工程 TE 石油、天然气工业 TF 冶金工业 TG 金属学与金属工艺 TH 机械、仪表工业
TJ 武器工业 TK 能源与动力工程 TL 原子能技术 TM 电工技术 TN 无线电电子学、电信技术 TP 自动化技术、计算机技术 TQ 化学工业 TS 轻工业、手工业 TU 建筑科学 TV 水利工程 青岛理工大学图书馆 2017/2/28

27 中图法标记示例 例如: TU832.17 太阳能采暖系统 参见TK51 TU8(三级类目) 房屋建筑设备
青岛理工大学图书馆 2017/2/28

28 《中图法》组织的分类索引示例 建筑物工程预算与重置成本的比较 F293.35,TU723.3
建筑物 工程预算 重置成本 房地产估价 工程决算 环境工程预算审查中常见的问题及其对策 X5,F284 环境工程 预算 工程预算 审查 人工智能技术在建筑工程预算中的应用 TU723.3,TP18 建筑工程预算 人工智能 框架 工程造价 野生植物资源信息检索数据库的建立和使用 Q94-37,G252.7 野生植物 数据库 计算机检索 使用说明 网上搜索引擎的几个理论问题 TP393,G354.4 搜索引擎 理论研究 因特网 计算机检索 青岛理工大学图书馆 2017/2/28

29 国际专利分类法 (IPC—International Patent Classification)
分类原则 IPC采用以功能分类与应用分类相结合,以功能分类优先的原则。 功能分类是根据发明创造成果的内在性质或功能进行分类,并在分类表中设置了相应的分类位置,称其为功能分类位置; 应用分类原则是根据发明创造成果的特殊用途或应用范围进行分类,并在分类表中设置了相应的分类位置,称其为应用分类位置。 适用于两个以上技术领域的发明创造,应优先分在功能分类的位置。 青岛理工大学图书馆 2017/2/28

30 国际专利分类表八个部所涉及的技术范围是:
——A部:生活需要 ——B部:作业;运输 ——C部:化学;冶金 ——D部:纺织;造纸 ——E部:固定建筑物 ——F部:机械工程;照明;加热;爆破 ——G部:物理 ——H部:电学 青岛理工大学图书馆 2017/2/28

31 例1:录音机、录像机、电唱机、光盘机和磁盘机等,其共同的特点都是通过信息记录载体和传感器之间的相对运动这一功能完成的信息存储和重现,所以在IPC中,为这种信息记录和重现主题专门设置了一个类G11(信息存储),这个小类就是功能分类位置。 例3:小类B01D分离,是个功能性小类,包括各种过滤器、过滤方法;分离装置、分离方法。如蒸发、过滤、蒸馏、沉淀以及信件分拣工作等。但另有几个小类也涉及到过滤器,如:A47J31/06咖啡(或茶)过滤器,A01J11/06牛奶过滤器,D01D1/10人造丝纺织设备中用的聚合物焙化(或溶液)过滤器等应用性小类。 青岛理工大学图书馆 2017/2/28

32 IPC 分 类 号 构 成 示 例 部 B 作业;运输(由一个大写字母表示)
小类 B64C 飞机;直升飞机(由大类号加一个字母表示) 大组 B64C25/00 起落装置(由小类号加1~3位数字及斜线和00(/00)表示) 一点小组 /02 ·起落架(将主组斜线后的00改为其它1~5位数字而来) 二点小组 /08 ··非固定的,如可抛弃的 三点小组 /10 ···可收放的,可折叠的或类似的 四点小组 /18 ····操作机构 五点小组 /26 ·····操纵或锁定系统 六点小组 /30 ······应急动作的 IPC类名应结合其上位类完整表述。例如,分类号B64C25/30代表的类是指飞机或直升飞机上的起落装置用的一种非固定式的可收放的、可折叠的起落架的操纵机构应急动作的操纵或锁定系统,而不能简单地读作“应急动作的”。 青岛理工大学图书馆 2017/2/28

33 主题检索途径——主题语言 检索工具或检索系统按某种特定的主题词字顺组织文献信息,允许检索用户以表征文献主题内容的词、词组或短语作为检索入口词查找文献信息的检索途径称为主题检索途径。按某种主题词语言规则组织的正文或主题索引提供了相应的主题检索途径。使用主题检索途径进行检索,首先必须根据待检课题内容,依据所用检索工具或检索系统所使用的特定主题语言进行标引,确定能够体现课题实质性内容特征的主题词,然后使用引得的主题词利用主题索引或直接使用按主题组织的正文进行检索,查出有关文献信息。 青岛理工大学图书馆 2017/2/28

34 主题语言类型 按是否规范化:受控词(标题词、单元词、叙词);非受控词(自由词)(关键词)
按组配方式:先组式(标题词);后组式(叙词、单元词、关键词) 青岛理工大学图书馆 2017/2/28

35 单元词 1、概念 单元词——是指从文献中抽出的并经过规范化处理的能够表达文献主题的最小、最基本的词汇单位。 2、特点
强调词间的灵活组配,能够表达任何想表达的概念;但标引的一致性比较差,容易产生误检。 青岛理工大学图书馆 2017/2/28

36 第三节:检索的一般程序和策略 一、分析用户的信息检索要求
用户信息查询的产生,是信息检索与信息检索系统存在的基础,而满足用户的信息需求,则是建立检索系统的出发点,具体说对用户信息检索需求的分析主要应该包括如下几个方面: (1)检索请求的内容特征分析 主要涉及对用户信息请求所属的学科范围与主题范围的确定,需要使用的主要概念及其相互关系以及相关名词术语的选择等。 (2)检索请求的形式特征分析 主要包括信息检索所要获取的检索结果数量的估计、所要求的文献的语种、年代、类型、有关著者机构等等 青岛理工大学图书馆 2017/2/28

37 即用户是为了什么目的而需要查询检索系统的,检索目的不同,将直接影响到后面检索策略的制定。明确课题对查新、查准和查全的指标要求。例如:
(3)明确检索目的 即用户是为了什么目的而需要查询检索系统的,检索目的不同,将直接影响到后面检索策略的制定。明确课题对查新、查准和查全的指标要求。例如: 若要了解某学科、理论、课题等最新进展和动态,则要检索最近的文献信息,强调“新” 若要解决研究中某具体问题,找出技术方案,则要求检索有针对性、能解决实际问题的文献信息,强调“准” 若要撰写综述、述评或专著等,要了解课题、事件的前因后果、历史和发展,则要检索详尽、全面、系统的文献信息,强调“全” 青岛理工大学图书馆 2017/2/28

38 检索策略的概念:检索策略就是在分析情报提问实质的基础上,确定检索途径与检索用词,并明确各词之间的逻辑关系和查找步骤的科学安排。(陈光祚)
二、制定检索方案(构造检索策略) 检索策略的概念:检索策略就是在分析情报提问实质的基础上,确定检索途径与检索用词,并明确各词之间的逻辑关系和查找步骤的科学安排。(陈光祚) 构造一个好的检索策略,往往涉及到各方面的知识和技能,诸如:是否了解检索系统的特性与功能;是否熟悉所检数据库的标引规则及词表结构;是否掌握必要的检索方法与技术;是否了解所检课题的专业知识等等。 青岛理工大学图书馆 2017/2/28

39 1、确定检索范围:专业(内容)、年代跨度(时间)、地区(地理、语言) 2、选择检索手段:手工检索、计算机检索、国际联机检索、网络搜索等。
主要考虑检索的效率(全、准、快)、课题要求和课题费用等情况 青岛理工大学图书馆 2017/2/28

40 3、选择检索系统:主要从工具或系统内容(专业性、综合性)和性能(检索效率、覆盖面、权威性、使用费等)上比较考虑
检索工具或检索系统的研制者情况; 检索工具或数据库的收录范围,通常会涉及学科主题、信息(文献)类型、使用语种、年代跨度等方面; 索引或数据库的标引处理规则及所使用的词表; 检索工具或系统提供的主要检索途径及相应功能。 青岛理工大学图书馆 2017/2/28

41 4、选择检索方法: (1)直接检索(工具法或常用法) 通过信息检索工具或检索系统获取所需的信息。
按所查文献的顺序,可分为顺查法、倒查法和抽查法三种。 顺查法——由远而近,从问题发生的年代开始逐年往近查,适用于无综述性文献可参考时使用。查的文献较完整,查全率较高,但工作量大,效率不高。 倒查法——由近到远,重点放在近期的文献,多用于新课题,或老技术的新发展,从新情况开始查到一定的基本资料时为止。 抽查法——根据课题的特点和需要,选查发展旺盛时期的文献,可节约时间,但可能会漏检。 青岛理工大学图书馆 2017/2/28

42 (2)间接检索(追溯法、回溯法或引文法) 是从已有的文献后面所附的参考文献入手,逐一查找全文,再从这些原文后面所列的参考文献逐一追查,不断扩大检索线索,从而获得一批相关文献信息的查找方法。 (3)综合法(循环法) 结合追溯法和常用法,先利用检索系统查出一定时期内的一批有用文献,再利用这些文献后面的参考文献,追溯查出前一时期内的文献,如此循环交替的使用两种方法直到满足要求为止。 青岛理工大学图书馆 2017/2/28

43 5、选择检索途径和检索入口词: 确定在待检数据库中的检索途径 选择合适的检索词,并将之转换为系统能接受的检索标识。 青岛理工大学图书馆
2017/2/28

44 课题:数字资源的合理使用问题(VIP数据库) 字面检索 关键词=合理使用 and 关键词=数字资源 检索结果:6条
入口词的选择和扩展 注意隐含概念、下位概念和同义词等的使用 课题:数字资源的合理使用问题(VIP数据库) 字面检索 关键词=合理使用 and 关键词=数字资源 检索结果:6条 分析所获得的文章发现,数字资源的“合理使用”主要涉及“知识产权”(隐含概念)问题,而知识产权的下位概念“著作权”和“版权”显然也应该是必须关注的。 青岛理工大学图书馆 2017/2/28

45 同义词:电子资源,数字出版物,电子出版物 下位词:电子期刊、数字期刊、电子图书、数字图书等 可以通过逻辑检索算符处理相关词
数字资源的相关词还应包含: 同义词:电子资源,数字出版物,电子出版物 下位词:电子期刊、数字期刊、电子图书、数字图书等 可以通过逻辑检索算符处理相关词 若以专业为检索算式表达,则为: (题名或关键词=数字资源+电子资源+电子期刊+数字期刊+电子图书+数字图书+数字出版物+电子出版物)*(题名或关键词=知识产权+合理使用+著作权+版权) 在同一时段检出2710条 通常,合理使用高级检索和二次检索相结合的方式也可实现上述检索式的效果 青岛理工大学图书馆 2017/2/28

46 青岛理工大学图书馆 2017/2/28

47 一次检索结果数 二次检索结果数 青岛理工大学图书馆 2017/2/28

48 查新选词及其扩展思路 注意检索词的缩写、简称与俗称 项目名称:乙型病毒性肝炎的中医药研究
CNKI: (题名=乙型病毒性肝炎*(中医药+中药)) 篇 维普: (题名=(乙型病毒性肝炎+乙型肝炎+乙肝+HB)*(中医药+中药)) 554篇 青岛理工大学图书馆 2017/2/28

49 查新选词及其扩展思路 具有特异色彩的字-词-符号的选用 项目名称:客运专线双块式无砟轨道施工技术
查新点: 有效解决了时速350 km/h的高速铁路客运专线双块式无砟轨道长线高精度施工的物流组织难题; 建立高精度的CPⅢ控制网, 精度控制在0.5 mm以内; 改善砼配合比以在桥上采用泵送混凝土。 CNKI: (题名=无砟 or 题名 = 无碴) and 题名 = 350 (精确匹配)(14篇) 青岛理工大学图书馆 2017/2/28

50 青岛理工大学图书馆 2017/2/28

51 检索途径的选择 以主题法为首选路径——选词并在不同字段组配 项目名称:污泥低温碳化装置
查新点: 污泥低温碳化温度为240~260 ℃, 碳化后的泥饼含水率为50% 左右…… 青岛理工大学图书馆 2017/2/28

52 扩展英文检索词(组)的选词视野—— ◆ 利用互联网上的“CNKI翻译助手”(http://dict.cnki.net/)
◆ 用谷歌搜索引擎寻觅词频较高的英文词组 ◆ 词表中对应的英文词汇 ◆ 全国科学技术名词审定委员会网站( ◆ 国家标准中的英文题目用词 ( ◆ 用中国专利号反查英文词 (from the database) ◆ 利用专利分类号从检出的英文专利中选词 ◆ EI等数据库中的关键词索引 ◆ 从检出的中文文献的英文文摘中选词 青岛理工大学图书馆 2017/2/28

53 检索途径的选择 以主题法为首选路径——选词并在单一字段组配 项目名称: 利用测井资料评价地应力技术研究
查新点: 结合滩海地区目的层特点, 通过对井径、方位、快、慢横波曲线进行分析, 确定出适合滩海地区的地应力方向评价方法; 引入了地层影响系数的概念, 使最大和最小水平主应力计算数值更加符合滩海地区规律; 利用测井资料的软件编制形成完整评价系统。 维普:(题名=测井*(应力+地层+倾角+斜角+成像+XMAC+横波+软件)*评) 维普:(题名=测井*方向*力) 1 成像测井资料在安棚油田地应力研究中的应用 2 成像测井资料在地应力计算中的应用 3 交叉偶极子阵列声波测井资料在裂缝性储层评价中的应用 4 综合应用测井资料分析现今地应力方向 5 利用测井资料评价地层压力方法研究 6 井壁电成像测井资料定量评价裂缝的研究 青岛理工大学图书馆 2017/2/28

54 以主题法为首选路径——选词并在不同字段组配
维普库检索:食品接触材料用油墨及胶粘剂安全标准体系研究 青岛理工大学图书馆 2017/2/28

55 分类法检索的运用 项目名称:军队政治工作管理系统 维普: (题名或关键词=政治+政工-(市政+行政+民政))*(文摘=管理系统)
维普: (分类号=TP3*(E22+D64)) 维普: (分类号=TP31)*(题名=政治+政工-(市政+行政+民政)) {TP31 计算机软件; E22 军队政治工作; D64 思想政治教育} 青岛理工大学图书馆 2017/2/28

56 分类法检索的运用(分类号之间的组合) 项目名称:球墨铸铁的损伤力学研究
维普: (分类号=TF593.2+TG143.5+TG255)*(分类号=O346.5) 1 单拉试样颈部应力状态及对材料细观损伤的影响 2 球墨铸铁损伤力学特性研究的新方法 维普: (题名或关键词=球墨铸铁*损伤力学) 1 球墨铸铁损伤力学特性研究. 2 铁素体球墨铸铁损伤力学特性的研究 3 铁素体球墨铸铁损伤力学特性 4 珠光体球墨铸铁损伤力学性能的研究 5 在拉伸载荷下铁素体球墨铸铁损伤力学特性 6 球墨铸铁损伤力学特性研究的新方法 TF593.2—球墨铸铁(冶炼); TG143.5—球墨铸铁(材质) TG255—球墨铸铁(铸件); O346.5— 损伤力学 青岛理工大学图书馆 2017/2/28

57 主题-分类组合检索 项目名称: 轮式装备铁路运输捆绑加固器 维普: (分类号=U294.25)*(题名=固)
1 优化挖掘机装载加固方案的探索 2 改善超限轮式车辆铁路运输装载加固的措施 专利: B61D45/00*(加固+固紧+固定)*(装+运) {B61D45/00 铁路车辆特有的固定或支承货物的工具或设备} 1 CN 轮式重型装备运输加固调位装置 2 CN 轮式车辆固定装置 3 CN 轮式重型装备运输捆绑加固装置 4 CN 一种圆柱形及轮式货物运输装载加固用三角挡 5 CN 铁路平车铁底板轮式装备加固装置 青岛理工大学图书馆 2017/2/28

58 根据所选词的重要性程度和相互间的逻辑关系,排定词间顺序,用系统提供的检索运算符将所选词构造成检索提问式。
6、构造检索提问式(拟定检索表达式) 根据所选词的重要性程度和相互间的逻辑关系,排定词间顺序,用系统提供的检索运算符将所选词构造成检索提问式。 检索案例: 城市垃圾综合处理 市* ( 垃圾+ 废物+ 废弃物) * ( 处理+ 回收+ 再生+ 利用) 青岛理工大学图书馆 2017/2/28

59 检索案例: 中国历年来社会保障制度研究综述
由于维普期刊库有正规的主题标引,其单汉字索引方式,实现了先进的模糊检索功能,选用它来实施交互扫描式策略比较方便。首先明确综述是针对某专题进行综合叙述的科学文体,另外与之相关的,在综述的基础上加以评论的研究报告叫做述评,也称评述。再根据课题名称,粗略地用检索式“中国* 社会保障制度* 研究”进行摸底性搜索,发现命中的文献不多; 浏览相关记录后,用“社会保障”取代“社会保障制度”,以减少限制条件,其命中量大幅增长; 再舍去“研究”一词,查全率明显提高。 在检索中对于一些不能明确表达主题内容、没有检索意义的泛指概念( 如研究、方法、作用等) ,一般不宜使用。通过初步摸底后再进行主题分析,确定了3个主要的概念组面“中国”、“社会保障”、“综述”; 经过多次“交互扫描”后的浏览、分析、选择,尽可能全面地选取表达各概念组面的相关检索词; 然后确定最终的检索式,便可以进行正式检索了。 青岛理工大学图书馆 2017/2/28

60 1) 如要确保查准率,便限定在题名字段检索,其检索式如下:
由于查全率和查准率之间存在着一种“互逆”关系,因此高查全率和高查准率难以同时获得; 在检索时,应该根据实际需要,对检索结果的查全率或查准率有所侧重。 1) 如要确保查准率,便限定在题名字段检索,其检索式如下: (中国+ 我国+ 国内+ 全国) * (社会保障+ 社保)* (综述+ 述评+ 评述) 2) 若要提高查全率,首先可以考虑去掉“中国”这个概念组面( 在国内数据库检索时,可以省略) ,增加命中量; 另外指定在“题名或关键词”字段搜索,以扩大查找范围。故使用下列检索式: (社会保障+ 社保) * (综述+ 述评+ 评述) 有些仅从题名无法识别的综述、述评文献,因维普期刊库二次加工标引的关键词“综述”、“述评”可被检索到。通过进一步浏览,分析命中文献,发现与“社会保障”相关的词语还有“社会福利”、“社会救助”、“社会保险”、“社会养老”,等等,因此再增补检索式如下: 社会* ( 福利+ 救助+ 保险+ 养老+ 就业) * ( 综述+ 述评+ 评述) 最终获得理想的查全效果。 青岛理工大学图书馆 2017/2/28

61 7、编排具体的检索程序 如果是同时结合使用多种检索手段:则应确定各种手段的先后;
如果选用了多种工具或系统:则应确定使用各种工具的先后(一般按相关程度安排先后); 如果准备了多个检索提问式,则应排出使用的先后顺序。 青岛理工大学图书馆 2017/2/28

62 8、检索式的反馈调整 试检并初步浏览检索结果 使用合适的相关反馈调整方法,对检索结果进行优化 “变”是检索策略的永恒主题
一个令人满意的检索工作基本都是在 “检索 阅读 策略调整 再检索……” 的过程中不断调整和完善的 青岛理工大学图书馆 2017/2/28

63 获得了比较满意的结果后,要进行结果的整理,包括输出格式、显示顺序、去重、全文下载等。
三、正式检索 输入检索词或检索式 四、获取并整理检索结果 获得了比较满意的结果后,要进行结果的整理,包括输出格式、显示顺序、去重、全文下载等。 青岛理工大学图书馆 2017/2/28

64 最后环节是对本次检索进行分析和评价,主要包括:
五、分析评价检索操作与检索结果 最后环节是对本次检索进行分析和评价,主要包括: 检索结果分析 检索系统功能的评价和认识 检索操作中存在的主要问题等。 一般在对检索操作和检索结果进行分析和评价时,需要涉及并使用到很多指标,最为常用和重要的两个检索效果评价指标就时查全率和查准率。 青岛理工大学图书馆 2017/2/28

65 计算机检索的步骤 课题分析 选择检索系统 确定检索途径和检索方法 确定检索词 制定检索策略,编制检索式 实施检索、分析检索结果、索取原文
调整检索式,优化策略 青岛理工大学图书馆 2017/2/28

66 检索案例1 课题:一种海水淡化的方法及装置 一、内容要点: 本方法采用精馏法,尤其是减压精馏法来除盐。其主要特征:
在脱盐器(精馏塔)内有分离介质,如填料或分离塔板等; 有明确的精馏段、提馏段; 塔顶有回流控制装置。 青岛理工大学图书馆 2017/2/28

67 二、选用的检索数据库 中文科技期刊数据库 中国学术期刊全文数据库 中国优秀学术论文数据库 中国学位论文全文数据库 EBSCO
Springer 青岛理工大学图书馆 2017/2/28

68 三、选用的检索词及检索策略 中文词: 海水* 脱盐* 淡化* 海水脱盐* 海水淡化* 外文词
海水* 脱盐* 淡化* 海水脱盐* 海水淡化* 外文词 sea water(seawater海水);desal*(desalinate、desalt、desalinize,etc脱盐);distill*(蒸馏);rectif*(精馏);fractionat*(分馏);reflux(回流);backflow(回流、逆流) 青岛理工大学图书馆 2017/2/28

69 4、( sea water or seawater ) and desal*
中文数据库 1、海水* and (脱盐* or 淡化*) 2、海水脱盐* or 海水淡化* 3、#1 or #2 外文数据库 4、( sea water or seawater ) and desal* and (distill* or rectif* or fractionat* or reflux or backflow) 青岛理工大学图书馆 2017/2/28

70 利用搜索引擎查询关于“小细胞肺癌放射治疗”的PPT资料 小细胞肺癌的同义词:SCLC 百度:
搜索引擎检索案例 利用搜索引擎查询关于“小细胞肺癌放射治疗”的PPT资料 小细胞肺癌的同义词:SCLC 百度: filetype:ppt ("小细胞肺癌" | " SCLC ") GOOGLE: "小细胞肺癌" OR "SCLC" filetype:ppt 青岛理工大学图书馆 2017/2/28

71 QQ: 青岛理工大学图书馆 2017/2/28


Download ppt "计算机检索基本知识 贾芳华 fhwaj@163.com fhwaj@qtech.edu.cn QQ:149552480 青岛理工大学图书馆信息部 0532-85071729 青岛理工大学图书馆 2017/2/28."

Similar presentations


Ads by Google