第三章 文献信息检索基本理论 概述 检索语言 检索工具 文献信息检索的方法和途径.

Slides:



Advertisements
Similar presentations
第二章 文献检索基本知识.
Advertisements

联系电话: 联 系 人:李爱玲 中国人文社会科学文献(CASHL)传递 联系电话: 联 系 人:李爱玲
文 献 检 索与利用 第四章 信息检索工具 点击进入 END.
文献信息检索 第三章 文献信息检索的基本知识 ——主讲:蒋时雨 学习要点: △掌握文献信息检索的基本原理、方法和步骤
第一章 医学文献检索概论 文献检索教研室.
——Windows98与Office2000(第二版) 林卓然编著 中山大学出版社
LSF系统介绍 张焕杰 中国科学技术大学网络信息中心
杨宇航 百度社区技术部 推荐技术在 百度UGC产品中的应用 杨宇航 百度社区技术部
The Graduation Thesis Defense
第一节 主表结构 第二节 标记符号 第三节 复分表等
医学文献检索 绪论 中山大学医学文献检索学教研室 周 纯.
医学文献检索 绪论 中山大学医学文献检索学教研室 周 纯.
人大复印资料全文数据库 人大复印资料全文数据库选辑1995年至今公开发表的人文科学和社会科学中各学科、专业的重要论文和重要动态资料的全部原文。其信息资源覆盖了人文科学和社会科学领域国内公开出版的3000多种核心期刊、专业期刊和报纸,分4大类100多个专题。
初级会计电算化 (用友T3) 制作人:张爱红.
下一页 地球——人类的母亲 她摆脱过多少 漫漫黑夜的折磨 翻过去她却难忘记
北京协和医学院 博硕学位论文库
书生之家电子图书使用说明 图书馆信息部.
植物资源学 主讲人:王海英 副教授.
记账凭证的填制 唐山工业职业技术学院 管理工程系 姚雪超.
第四次大作业 登陆学校图书馆网站的电子数据库
全国计算机等级考试 二级基础知识 第二章 程序设计基础.
计算机基础知识 丁家营镇九年制学校 徐中先.
§1 了解中国图书分类法 §2 了解图书馆书刊排放规律 §3 了解馆藏的外延及其使用途径 §4 了解图书馆文献的揭示方式 主要内容
The Principles and Techniques of Social sciences Information Retrieval
第二章 信息检索基本知识 第三节 信息检索与检索系统.
《数据库原理及应用》课程介绍 信息工程学院 孙俊国
有机所文献利用快速指南 平台入口: 图书馆网站 文献、数据检索:
PRESENTED BY OfficePLUS
第一节 旅游规划的意义和种类 第二节 旅游规划的内容 第三节 旅游规划的编制 第四节 旅游景区规划
如何使用CiteSpace分析Derwent专利数据
LSF系统介绍 张焕杰 中国科学技术大学网络信息中心
李杰 首都经济贸易大学 安全与环境工程学院 个人主页:
管理信息结构SMI.
第一单元 初识C程序与C程序开发平台搭建 ---观其大略
数据库检索指南 SpringerLink全文电子期刊.
用户如不能得到原始文献或原文复印件,通过先进手段迅速检索到的医学信息就毫无价值!
以ISI平台为例,为您演示一下如何在Endnote文献中查看该文献的References
第17章 网站发布.
数据库检索指南 ACM数据库.
园林专业本科阶段课程拓扑图:平台期课程 通识 12 数学 14 物理 4 化学 11 英语 6 政治 14
信息检索与利用 江苏大学图书馆 lib.ujs.edu.cn MeSH主题词表及应用 张壬
中国科学技术大学计算机系 陈香兰(0551- ) Spring 2009
ScienceDirect高级检索功能及使用视频、说明发现路径
Science and technology report service systemUsage method
指导老师:John Doe 报告人:宝藏PPT
美国数学学会 MathSciNet 电子资源的检索和使用
科技文献检索与利用.
The Graduation Thesis Defense
ScienceDirect高级检索功能及使用视频、说明发现路径
请在此位置添加你的论文名称 指导老师:PPT教授 报告人:清风素材.
C语言程序设计 主讲教师:陆幼利.
学习目标 1、什么是字符集 2、字符集四个级别 3、如何选择字符集.
ASP New and other UIs: Medical Videos Searchasaurus
计算机及办公软件应用 ©2013 苏州工业园区职业技术学院
如何查询论文的收录号?.
2019/4/16 关注NE官方微信,获取更多服务.
中国国家标准文献 共享服务平台检索 信息检索与利用 2019/4/29 王婧怡 图书馆615室 科技信息研究所
2019/4/ /4/25 学习科研好助手 NoteExpress文献管理与检索系统 北京爱琴海乐之技术有限公司.
计算机网络与网页制作 Chapter 07:Dreamweaver CS5入门
项目二:HTML语言基础.
目录 01 选题背景和意义 02 论文结构 03 研究方法 04 分析讨论 05 主要结论 06 参考文献.
SpringerLink数据库使用说明 上海师范大学图书馆
GIS基本功能 数据存储 与管理 数据采集 数据处理 与编辑 空间查询 空间查询 GIS能做什么? 与分析 叠加分析 缓冲区分析 网络分析
中国学位论文全文数据库使用指南1.2 图书馆技术部 2012年9月.
第六章 Excel的应用 五、EXCEL的数据库功能 1、Excel的数据库及其结构 2、Excel下的数据排序 (1)Excel的字段名行
XX大学XX学院 多色复古论文答辩PPT模板 X124-2 蓝梦 学号.
RefWorks使用指南 归档、管理个人参考文献.
入侵检测技术 大连理工大学软件学院 毕玲.
超星电子书 让更多的人读更多的书.
辞典类 Oxford English Dictionary 牛津在线英语大辞典
Presentation transcript:

第三章 文献信息检索基本理论 概述 检索语言 检索工具 文献信息检索的方法和途径

第一节 概 述 文献信息检索的基本原理 文献信息检索的类型

一、文献信息检索的基本原理 文献信息→被选文献 ↓ 信息存储 概念分析 ↓标引 将概念转换成系统语言→用系统词表(分类、主题词表等) ↓ ↓ 信息存储 概念分析 ↓标引 将概念转换成系统语言→用系统词表(分类、主题词表等) ↓ 检索工具(数据库) ↓↑ 将概念转换成系统语言 ↑标引 信息检索 信息用户→信息要求→概念分析

二、文献信息检索的类型 1、按文献存贮内容分, A、文献检索 是指检索工具或计算机检索系统中所输入的内容是书目、题录或文摘,它们是文献内、外特征的描述和记载。 B、事实检索 是指检索工具或计算机检索系统中,存贮的是从原始文献中抽取的各种事实(如事物发生的时间、地点、人物、过程等)。 C、数据检索 是指检索工具或检索系统中,存贮的是大量数值型数据,如统计数据、科学技术常数等。

2、按文献存贮载体及检索手段分 A、手工检索 B、计算机检索 是用计算机来处理和查找信息的检索方式。包括光盘检索、联机检索和因特网信息检索

第二节、检索语言 一、检索语言的含义 二、检索语言的作用 三、检索语言的类型

一、检索语言的含义 检索语言——是根据情报检索的需要而编制的人工语言,它是信息检索系统存储与检索所使用的共同语言, 即在文献存储时,文献的内容特征(如分类号、主题词)和外表特征(如书名、著者、出版项等)按照一定的语言来描述,检索文献的提问也按照一定的语言来加以表达,这种在文献存储和检索过程中,共同使用、共同遵守的语言就是检索语言。又称情报语言、标引语言、索引语言等等。

二、检索语言的作用 (1)用以标引文献的主要概念,并保证不同标引人员标引文献的一致性。 标识——揭示文献内外特征的标签。如I235 标引——是对文献的内外特征及其它有检索意义的特征进行分析、描述,用检索标识记录下来,作为存取依据的文献处理过程。其实质就是将自然语言转换成系统语言,赋予文献主题以主题词或分类号的过程。 标识——揭示文献内外特征的标签。如I235 56 I31/12

著者 文献外部 标识 文献号(报告号、专利号等) 其他(篇名、刊名、出版单位等) 检索标识种类 分类号 分类语言 文献内容 标识 自然语言 关键词 主题词语言 主题词 单元词 标题词 叙词 人工语言

提取关键词练习 1、“森林飞机防火” “森林防火;飞机防火”,而不用泛指意义的“森林;飞机;防火”。 2、“中国农业经济建设”, 用“农业经济;经济建设;中国”,而不用“中国;农业;经济;建设”。 3、“青蛙洗衣粉” 用“青蛙牌商品;洗衣粉”,或“青蛙洗衣粉”,不用“青蛙;洗衣粉”。 4、“小麦的收获与加工” 小麦收获;小麦加工

提取关键词步骤: 找出显性主题概念(a)→找出隐性主题概念(b)→排除无关和重复概念,确定核心概念(c)。 例:土壤环境条件对豆科植物固氮作用的影响 a:土壤条件 豆科植物 固氮作用 影响  b:温度、湿度、ph值 大豆、花生等 固氮菌、根瘤菌等 C:去掉 影响

二、检索语言的作用(续) (2)使内容相同及相关的文献集中化(保证文献存储的集中和系统化),并揭示其相关性。如交通运输(U类)、生物科学(Q类)、农作物(S5)、林业(S7)、X(环境科学)。 (3)便于将标引用语与检索用语进行相符性比较,保证检索提问与文献标引的一致性,以及检索结果与检索要求的一致性。如马达 Y 电动机 (4)保证检索者按不同需要检索文献时,都能获得最高的查全率和查准率。

三、检索语言的类型

(一)体系分类语言 以《中图法》为例: 1.构成原理 2.体系分类表 3.体系分类语言的特点

1、构成原理 体系分类法是以学科分类为基础,以文献内容所涉及的学科属性为对象,运用概念的划分与概括方法,按知识门类的学科系统,采用从总到分、从一般到具体、从简单到复杂、从低级到高级的逻辑次序,进行层层划分。每划分一次,就产生许多类目,逐级划分就产生许多级别的类目。各级类目层层隶属,形成一个严格有序、直线性的层累制知识门类等级体系。每个类目用分类号(拼音字母+阿拉伯数字)作标记符号(标识,如S5),分类号表示类目在分类体系中的位置和排列次序。例如:F311

2、体系分类表,如《中图法》

体系分类表的构成 1)编制说明: 说明分类法的编制目的、编制原则、结构、使用方法等 1)编制说明: 说明分类法的编制目的、编制原则、结构、使用方法等 2)类目表: 能很好地体现学科的系统性,也能反映事物的派生、隶属、平行关系。其类目表由基本部类、基本大类(一级类目)、简表(二级、三级类目)、详表(四级、五级、六级类目)几部分组成。

简表(2-3级)

2-4级类目 S51 禾谷类作物 S5农作物 S55 绿肥作物 S562 棉 S52 豆类作用 S53 薯类作物

中草药(4-5级类目,详表) S567 药用作物 .1 木本 .2 草本(.21一年生,.22多年生) .3 菌类(如灵芝,茯苓等) .4 喜阴药物(人参,黄连等) .7 喜温药物(甘草等)

又如:2-3级类目 S41植物检疫 S42气象灾害及其防治 S4植物保护 S43病虫害及其防治 S44鸟兽类及其防治 S45有害植物及其清除

生物科学类(1-3级类目)

生物科学类(3-4级类目)

R 医药、卫生 R11 卫生基础科学 R12 环境卫生、环境医学 R13 劳动卫生 R14 放射卫生、战备卫生 R15 营养卫生、食品卫生

食品加工 TS2食品工业 TS21粮食加工工业 20 一般性问题 21 粮食加工工业 22 食用油脂加工工业 23 淀粉加工工业 24 制糖工业 26 酿造工业 27 饮料冷食制造工业 210 一般性问题 211 面粉工业 212 碾米工业 213 谷类制食品 214 豆类制食品 215 薯类制食品 216 儿童食品 217 方便食品 218 疗效食品 219 其他食品

TP 自动化技术、计算机技术 TP37 多媒体技术与多媒体计算机 TP38 其他计算机 TP39 计算机的应用

练习:给出下列各题的分类号 世界通史 K10 《陈毅》(剧本) I23(戏剧文学) 《陈毅的足迹 》 K82(中国人物传记) 《陈毅副总理答记者问 》 D82(中国外交) 烟草经营管理 F4 烟草栽培、育种等 S572 烟草加工工业 TS4(烟草工业) 中国农业经济 F31 日本等其它国家的农业经济 F32-37 园林植物育种、栽培等 S6 园林规划、设计等 TU986(园林规划与建设)

2、体系分类表(续) 3)辅助表(复分表): 辅助表分为通用复分表和专用复分表。通用复分表包括“总论复分表”、“世界地区表”、“中国地区表”、“国际时代表”、“中国时代表”、“中国民族表”等;专用复分表则插在主表中的有关部分。

2、体系分类表(续) 4)类目索引: 是把分类表中的全部类目、类目的同义词、新旧词以及注释中包括的若干小主题作为标目,按字顺排列起来,并注明其相应的分类号,是从主题检索分类号的工具。 5)附录: 是其它必要的补充部分。如《中国图书馆分类法》历届编委员等。

3、体系分类语言的特点 1)便于族性检索 2)用号码作标识,国际通用性较好 3)落后于学科的发展 4)不能反映学科之间的交叉性和多样性。 5)类目缺乏专指性、容纳性和广泛性(采用等级列举表达从属关系,上位类目一定包含其各个下位类目,而下位类目一定带有上位类目的属性) 分类号越长,表示的学科范围越窄。为了清楚醒目, 通常在分类号的第三位数字后,隔以,如F279.712,TQ321.4

4、中图法-索书号(call number) 组成:分类号+书次号 如I231.12 45 分类号:按学科分类图书 书次号:区分同类图书,有两种取法: 种次号:同一分类号的图书按到馆的先后顺序给予号码。 著者号:按著者名称(代码)来区分同一分类号下的不同文献

(二)主题词语言(主题法) 1、关键词语言 2、单元词语言 3、标题词语言 4、叙词语言 仅介绍关键词语言

关键词语言 (2)关键词存在的主要问题: Aircraft 土豆 Planes (1)关键词的来源—直接来源于文献篇名、正文和文摘,具有实际意义的带关键性的词语,禁用词(stop-term)如冠词,介词,副词等除外,属自然语言。 (2)关键词存在的主要问题: A、 同义词标引--引起漏检 主题检索体系是按主题词字顺排列的,而用于标引的关键词呈现出多种字面形式——同义词时,将使同一主题的文献分散到不同的字顺位置,使查全率受到影响。 例:飞机 Airplane 马铃薯 洋芋 Aircraft 土豆 Planes

同义词如: 名称 维普题录库检全率% 维普文摘库检全率% 山药 73 74 薯蓣 26 24 薯药 怀山 3

B、多义词标引--引起误检 多义词 杜鹃 花  鸟 输入检索词“杜鹃”,结果是杜鹃花和杜鹃鸟均被检出 两个完全不同的概念

第二节、检索工具 检索工具的职能 检索工具的特征 检索工具的类型

一、检索工具的职能 检索工具——用来报道、存储和检索文献线索的一种工具。分为手工检索工具、计算机检索工具和网络检索工具: 报道——它把大量分散的文献收集起来以题录或文摘等形式予以报导,揭示文献的具体内容。 存储——将文献的内外特征著录下来,成为一条条文献线索,并按一定的原则系统地排列起来,构成一个可供人们从不同途径加以利用的集合体。 检索——通过一定的检索途径和方法,从检索工具中查出所需文献的过程。

二、检索工具的特征 1、必须详细而又完整地著录文献的内外特征 2、必须提供多种检索标识 3、全部标识必须系统地科学地排列成一个有机整体 4、能够提供多种检索途径

三、检索工具的类型 按编著方式:分为目录、题录、文摘等 1、目录——以单位出版物为著录对象,揭示出版物的外部特征。(如国家书目、出版社与书店目录、联合目录、馆藏目录等)。 著录格式为:书名 编者 出版地 出版单位 年月 书号 定价 开本等(或刊名 出版单位 刊期 刊号 定价等)。如 计算机等级考试5000题/瓮正科编(著).—北京: 清华大学出版社,1998.8, ISBN 7-302-02933-4 山地农业生物学报/贵州大学学报编辑部,双月刊 ISSN1008-0457,CN52-5013/S

2、题录 以单篇文献为著录对象,主要揭示出版物的外部特征。主要包含以下内容: 著者 题名(篇名)刊名 年 卷 (期) 起始页码 ISSN 等。如 【论文题名】 网络环境下信息检索与报道服务浅析 【英文题名】 Information Retrieval and Report Service in Network Environment 【作  者】 丁彩云 DING Cai-yun  【作者单位】 湖南化工职业技术学院,图书馆,湖南,株洲,412004 【刊  名】 株洲师范高等专科学校学报 【英文刊名】 JOURNAL OF ZHUZHOU TEACHERS COLLEGE 【年 卷 期】 2005 Vol.10 No.2 【关 键 词】 图书馆;网络环境;信息搜集;信息检索;信息报道 (计算机检索输出格式)

3、文摘 ISO214-1979(E)定义为:文摘是“一份文献内容的缩短的精确表达而无须补充解释或评论”;GB3793-83,文摘是“对文献内容作实质性描述的文献条目”,即题录+摘要, 【论文题名】 网络环境下信息检索与报道服务浅析 【英文题名】 Information Retrieval and Report Service in Network Environment 【作  者】 丁彩云 DING Cai-yun  【作者单位】 湖南化工职业技术学院,图书馆,湖南,株洲,412004 【刊  名】 株洲师范高等专科学校学报 【英文刊名】 JOURNAL OF ZHUZHOU TEACHERS COLLEGE 【年 卷 期】 2005 Vol.10 No.2 【关 键 词】 图书馆;网络环境;信息搜集;信息检索;信息报道 【摘  要】 网络环境下的信息服务已对图书馆的机构组织、人员素质、服务水平和社会地位产了巨大影响.掌握网络环境下的信息服务特点和方法,尽快适应网络环境已成为图书馆提高信息服务质量的重要课题. 分为指示性文摘(字数一般在50-300以内)和报导性文摘(字数在300-700字左右)两种。   

第三节、文献信息检索的方法和途径 一、主要检索方法 文献检索方法 综合法 引文法(跟踪法、追溯法) 常规法 顺查法 倒查法 拉网法

主要检索方法 1、拉网法 2、引文法(跟踪法、追溯法) 引文法就是利用文献后所附的参考文献、相关书目、推荐文章和引文注释查找相关文献的方法。 3、常规法(工具法) 是利用检索工具或检索系统进行查找的方法。

二、 检索途径 文献信息的检索途径主要有: 主题途径—根据主题词(标题词、关键词、单元词、叙词)查主题索引的。 分类途径—根据学科或分类号查目次表或分类索引。 著者途径—用个人著者或团体著者查著者索引(或机构索引) 号码途径—用某一号码(如报告号、专利号、合同号、ISBN等)查号码索引。 文献名称途径—用刊名或书名查刊名目录或书名目录

小结 检索语言的含义及作用 《中图法》结构 关键词的来源及提取 目录、题录、文摘的著录格式 文献信息检索的主要途径