目次 第1章 绪 论 第2章 信息检索基础 第3章 搜索引擎 第4章 事实和数值型信息检索 第5章 图书信息检索 第6章 期刊信息检索 第7章专利信息及商标信息检索 第8章 其他信息检索 第9章 检索案例选编 第10章 检索效率 第11章信息的分析利用
第10章 检索效率 10.1 概述 10.2 影响查全率的案例 10.3 影响查准率的案例 10.4 兼顾查全率和查准率的案例
10.1 概述 查全率=(检出相关文献量/文献库内相关文献总量)×100% 查准率=(检出相关文献量/检出文献总量)×100%
提高查全率的基本方法 1)扩大检索课题的目标,使用主要概念,排除次要概念。 2)跨库检索。例如使用国家科技图书文献中心的数据库或者Google实现对不同类型文献的一次性检索。 3)逐步扩大检索途径的检索范围。例如使用《中文科技期刊数据库》逐步提高查全率的字段依次是K=关键词/T=题名结合C=分类号→T=题名→K=关键词→R=文摘→U=任意字段。 4)取消限定条件。例如避免使用某些检索途径例如信息类型、语种、地理范围、年代范围。 5)降低检索词的专指度,可以从词表或检出文献中选一些上位词或相关词补充到检索式。 6)外文单词使用截词检索,可以采用前截断、后截断、前后截断等截词方法。 7)逐步扩大算符的检索范围,逐步提高查全率的算符依次是:位置算符w→nw→near→逻辑算符and→or。
提高查准率的方法 1)精确确定检索课题的目标,使用专业词汇。 2)选择专业性检索工具例如使用产品数据库、特种搜索引擎。 3)逐步缩小检索途径的检索范围,例如使用《中文科技期刊数据库》时,逐步提高查准率的字段依次是U=任意字段→R=文摘→K=关键词→T=题名→K=关键词/T=题名结合C=分类号;该数据库还能限定期刊范围:全部期刊→重要期刊→核心期刊。 4)用不太常用的检索途径例如信息类型、语种、地理范围、年代范围、作者或号码作为限定条件。 5)提高检索词的专指度,增加或换用下位词和专指度较强的自由词。 6)逐步缩小算符的检索范围,逐步提高查准率的算符依次是:逻辑算符or→and→位置算符near→nw→w;使用算符“not”排除干扰信息。
同时兼顾查全率和查准率的方法 1)跨库检索 2)分类途径和主题途径等多途径结合使用。 3)尝试多次检索 4)预防操作错误
10.2 影响查全率的案例 1.对课题的分析望文生义 2.检索工具收录范围有缺漏,功能较差 3.正确的常规检索方法也会有缺漏 4.用户选择不对口的检索工具 5.检索途径失误 6.选用了不规范的词 7.所选检索词与检索工具的用词习惯不符 8.遗漏隐含概念 9.遗漏了同义词 10.检索式有缺陷,限定条件过窄 11.误用禁用词
对课题的分析望文生义 实例:在Google检索我国生物技术在哪些地方比较发达?输入“生物技术 哪些地方 比较发达”为何检索不到信息?
对课题的分析望文生义 评析:难点是“发达”这个意思如何用关键词表达。在Google试用“我国生物技术发达地区”作为关键词进行检索,得知我们国家的生物技术还与国际发达国家有差距,不能检索到需要的信息。只要找出我国自己的生物技术研究机构的分布,就能达到检索目标。用检索式“我国生物技术 研究机构”搜索到“生物技术在线”,有《我国生物技术应用广泛》一文,文中提到:“我国生物技术产业通过20多年的发展已经初具规模,北京、上海、广州、深圳等地已建立了20多个生物技术园区。”故答案是在北京、上海、广州、深圳等地比较发达。
Google案例
Google案例
检索工具收录范围有缺漏 广西中医学院何报作教授在1994-2002年发表的中药研究论文有20篇被纸本型《中文科技资料目录—中草药》收录,而同期的数据库《中国学术期刊全文数据库》只收录了16篇。
正确的常规检索方法也会有缺漏 维普科技期刊数据库中经常出现的非规范术语等问题影响检索效率 粘合剂做关键词
粘固剂做关键词 胶粘剂做关键词
用户选择不对口的检索工具 查找机械制造方面的资料选用电气电子类的文摘;用Google等网上搜索引擎找专利文献,利用期刊论文类的检索工具查询图书,没有结果。 提高查全的方法:用一个工具检索多个数据库 如:NSTL
国家科技图书文献中心NSTL
检索途径失误 案例:检索课题“教学实验室的管理”的信息 维普检索 人大复印资料检索 维普检索结果 人大复印资料检索结果 自然科学试验居多 人大复印资料检索界面
遗漏隐含概念 课题:“垃圾处理方面”的研究,如何增加检索词? 分析:垃圾处理隐含垃圾利用、垃圾再生等含义。
遗漏隐含概念 课题“垃圾处理方面”的研究,如何增加检索词? 增添隐含概念
遗漏了同义词 课题:“开创了我国造山带中系统研究古地磁的先例” 。
课题分析:检索式m=“造山带*古地磁”检索到2篇,为何检索量较少?
遗漏了同义词 课题:“开创了我国造山带中系统研究古地磁的先例” 。
10.3 影响查准率的案例 1.分析课题缺乏精确性 2.检索工具的检索精度较差 3.检索词的专指度较差 4.增加限定的字段,提高查准率 5.增加检索词,提高查准率
增加限定的字段,提高查准率 课题:使用维普《中文科技期刊数据库》查询浙江大学高分子科学与工程系作者名为王立的文献
作者=王立 (作者=王立)*(机构=浙江大学)*全部期刊*年=2000-2006
增加检索词,提高查准率 检索课题“2003年春夏时装展”,要得到法国巴黎的2003的春夏时装展的资料。
增加检索词,提高查准率 检索式是:“2003年春夏时装展” 检索式调整为“巴黎 2003年 春夏时装展”
10.4兼顾查全率和查准率的案例 检索我国制糖业中工艺装置发展情况,如何在保证查全率前提下提高查准率?
k=制糖*(工艺*装置) 分类检索
检索式调整为:m=制糖*(工艺+装置) 检索式再调整为:m=制*糖*(工艺+装置)*c=ts243+ts244
思考题 1.影响检索效率的因素和解决办法是什么? 2.结合影响检索效率的案例,总结检索本专业综合课题可能遇到的困难。找出提高检索效率的方法。