Download presentation
Presentation is loading. Please wait.
Published byStefan Børresen Modified 5年之前
2
目次 第1章 绪 论 第2章 信息检索基础 第3章 搜索引擎 第4章 事实和数值型信息检索 第5章 图书信息检索 第6章 期刊信息检索
第7章专利信息及商标信息检索 第8章 其他信息检索 第9章 检索案例选编 第10章 检索效率 第11章信息的分析利用
3
第10章 检索效率 10.1 概述 10.2 影响查全率的案例 10.3 影响查准率的案例 10.4 兼顾查全率和查准率的案例
4
10.1 概述 查全率=(检出相关文献量/文献库内相关文献总量)×100% 查准率=(检出相关文献量/检出文献总量)×100%
5
提高查全率的基本方法 1)扩大检索课题的目标,使用主要概念,排除次要概念。
2)跨库检索。例如使用国家科技图书文献中心的数据库或者Google实现对不同类型文献的一次性检索。 3)逐步扩大检索途径的检索范围。例如使用《中文科技期刊数据库》逐步提高查全率的字段依次是K=关键词/T=题名结合C=分类号→T=题名→K=关键词→R=文摘→U=任意字段。 4)取消限定条件。例如避免使用某些检索途径例如信息类型、语种、地理范围、年代范围。 5)降低检索词的专指度,可以从词表或检出文献中选一些上位词或相关词补充到检索式。 6)外文单词使用截词检索,可以采用前截断、后截断、前后截断等截词方法。 7)逐步扩大算符的检索范围,逐步提高查全率的算符依次是:位置算符w→nw→near→逻辑算符and→or。
6
提高查准率的方法 1)精确确定检索课题的目标,使用专业词汇。 2)选择专业性检索工具例如使用产品数据库、特种搜索引擎。
3)逐步缩小检索途径的检索范围,例如使用《中文科技期刊数据库》时,逐步提高查准率的字段依次是U=任意字段→R=文摘→K=关键词→T=题名→K=关键词/T=题名结合C=分类号;该数据库还能限定期刊范围:全部期刊→重要期刊→核心期刊。 4)用不太常用的检索途径例如信息类型、语种、地理范围、年代范围、作者或号码作为限定条件。 5)提高检索词的专指度,增加或换用下位词和专指度较强的自由词。 6)逐步缩小算符的检索范围,逐步提高查准率的算符依次是:逻辑算符or→and→位置算符near→nw→w;使用算符“not”排除干扰信息。
7
同时兼顾查全率和查准率的方法 1)跨库检索 2)分类途径和主题途径等多途径结合使用。 3)尝试多次检索 4)预防操作错误
8
10.2 影响查全率的案例 1.对课题的分析望文生义 2.检索工具收录范围有缺漏,功能较差 3.正确的常规检索方法也会有缺漏
4.用户选择不对口的检索工具 5.检索途径失误 6.选用了不规范的词 7.所选检索词与检索工具的用词习惯不符 8.遗漏隐含概念 9.遗漏了同义词 10.检索式有缺陷,限定条件过窄 11.误用禁用词
9
对课题的分析望文生义 实例:在Google检索我国生物技术在哪些地方比较发达?输入“生物技术 哪些地方 比较发达”为何检索不到信息?
10
对课题的分析望文生义 评析:难点是“发达”这个意思如何用关键词表达。在Google试用“我国生物技术发达地区”作为关键词进行检索,得知我们国家的生物技术还与国际发达国家有差距,不能检索到需要的信息。只要找出我国自己的生物技术研究机构的分布,就能达到检索目标。用检索式“我国生物技术 研究机构”搜索到“生物技术在线”,有《我国生物技术应用广泛》一文,文中提到:“我国生物技术产业通过20多年的发展已经初具规模,北京、上海、广州、深圳等地已建立了20多个生物技术园区。”故答案是在北京、上海、广州、深圳等地比较发达。
11
Google案例
12
Google案例
13
检索工具收录范围有缺漏 广西中医学院何报作教授在 年发表的中药研究论文有20篇被纸本型《中文科技资料目录—中草药》收录,而同期的数据库《中国学术期刊全文数据库》只收录了16篇。
14
正确的常规检索方法也会有缺漏 维普科技期刊数据库中经常出现的非规范术语等问题影响检索效率 粘合剂做关键词
15
粘固剂做关键词 胶粘剂做关键词
16
用户选择不对口的检索工具 查找机械制造方面的资料选用电气电子类的文摘;用Google等网上搜索引擎找专利文献,利用期刊论文类的检索工具查询图书,没有结果。 提高查全的方法:用一个工具检索多个数据库 如:NSTL
17
国家科技图书文献中心NSTL
18
检索途径失误 案例:检索课题“教学实验室的管理”的信息 维普检索 人大复印资料检索 维普检索结果 人大复印资料检索结果 自然科学试验居多
人大复印资料检索界面
19
遗漏隐含概念 课题:“垃圾处理方面”的研究,如何增加检索词? 分析:垃圾处理隐含垃圾利用、垃圾再生等含义。
20
遗漏隐含概念 课题“垃圾处理方面”的研究,如何增加检索词? 增添隐含概念
21
遗漏了同义词 课题:“开创了我国造山带中系统研究古地磁的先例” 。
22
课题分析:检索式m=“造山带*古地磁”检索到2篇,为何检索量较少?
23
遗漏了同义词 课题:“开创了我国造山带中系统研究古地磁的先例” 。
24
10.3 影响查准率的案例 1.分析课题缺乏精确性 2.检索工具的检索精度较差 3.检索词的专指度较差 4.增加限定的字段,提高查准率
5.增加检索词,提高查准率
25
增加限定的字段,提高查准率 课题:使用维普《中文科技期刊数据库》查询浙江大学高分子科学与工程系作者名为王立的文献
26
作者=王立 (作者=王立)*(机构=浙江大学)*全部期刊*年=
27
增加检索词,提高查准率 检索课题“2003年春夏时装展”,要得到法国巴黎的2003的春夏时装展的资料。
28
增加检索词,提高查准率 检索式是:“2003年春夏时装展” 检索式调整为“巴黎 2003年 春夏时装展”
29
10.4兼顾查全率和查准率的案例 检索我国制糖业中工艺装置发展情况,如何在保证查全率前提下提高查准率?
30
k=制糖*(工艺*装置) 分类检索
31
检索式调整为:m=制糖*(工艺+装置) 检索式再调整为:m=制*糖*(工艺+装置)*c=ts243+ts244
32
思考题 1.影响检索效率的因素和解决办法是什么? 2.结合影响检索效率的案例,总结检索本专业综合课题可能遇到的困难。找出提高检索效率的方法。
Similar presentations