第二章 信息检索基本知识 第三节 信息检索与检索系统.

Slides:



Advertisements
Similar presentations
Lib.ujs.edu.cn 信息检索与利用 叙词语言 张壬 lib.ujs.edu.cn 信息检索与利用 主要内容 叙词语言的概念 叙词语言的应用 中国中医药学主题词表及其应用 叙词语言的优缺点.
Advertisements

练一练: 在数轴上画出表示下列各数的点, 并指出这些点相互间的关系: -6 , 6 , -3 , 3 , -1.5, 1.5.
图 书 馆 导 引.
单项选择题 判断题 陈 琳.
联系电话: 联 系 人:李爱玲 中国人文社会科学文献(CASHL)传递 联系电话: 联 系 人:李爱玲
文献信息检索 第三章 文献信息检索的基本知识 ——主讲:蒋时雨 学习要点: △掌握文献信息检索的基本原理、方法和步骤
第一章 医学文献检索概论 文献检索教研室.
第三章 文献信息检索基本理论 概述 检索语言 检索工具 文献信息检索的方法和途径.
一、 中图法发展历程 二、 中图法的体系结构 三、 中图法的标记系统 四、 分类排架
LSF系统介绍 张焕杰 中国科学技术大学网络信息中心
中国科大图书馆:赵光林 《中图法》知识讲座 中国科大图书馆:赵光林
山东英才学院 SHANDONG YINGCAI UNIVERSITY
医学文献检索 绪论 中山大学医学文献检索学教研室 周 纯.
医学文献检索 绪论 中山大学医学文献检索学教研室 周 纯.
人大复印资料全文数据库 人大复印资料全文数据库选辑1995年至今公开发表的人文科学和社会科学中各学科、专业的重要论文和重要动态资料的全部原文。其信息资源覆盖了人文科学和社会科学领域国内公开出版的3000多种核心期刊、专业期刊和报纸,分4大类100多个专题。
初级会计电算化 (用友T3) 制作人:张爱红.
证券投资技术分析.
第三讲文献检索语言2.
北京协和医学院 博硕学位论文库
常用逻辑用语复习课 李娟.
书生之家电子图书使用说明 图书馆信息部.
会计学专业基础课堂之 基础会计(初级会计) 安徽财经大学会计学院.
第四次大作业 登陆学校图书馆网站的电子数据库
第一章 商品 第一节 价值创造 第二节 价值量 第三节 价值函数及其性质 第四节 商品经济的基本矛盾与利己利他经济人假设.
图书的分类、编目与排架 一,图书馆藏书的组织 图书馆通过对到馆图书进行分类、编目与排架,使之形成一个
全国计算机等级考试 二级基础知识 第二章 程序设计基础.
§1 了解中国图书分类法 §2 了解图书馆书刊排放规律 §3 了解馆藏的外延及其使用途径 §4 了解图书馆文献的揭示方式 主要内容
The Principles and Techniques of Social sciences Information Retrieval
                                                                                                                                                                
百链 1.
有机所文献利用快速指南 平台入口: 图书馆网站 文献、数据检索:
如何使用CiteSpace分析Derwent专利数据
LSF系统介绍 张焕杰 中国科学技术大学网络信息中心
李杰 首都经济贸易大学 安全与环境工程学院 个人主页:
数据库检索指南 SpringerLink全文电子期刊.
用户如不能得到原始文献或原文复印件,通过先进手段迅速检索到的医学信息就毫无价值!
以ISI平台为例,为您演示一下如何在Endnote文献中查看该文献的References
第17章 网站发布.
信息检索与利用 江苏大学图书馆 lib.ujs.edu.cn MeSH主题词表及应用 张壬
数据挖掘工具性能比较.
搜 刘智 iLife信息素养协会 索.
第3章 信息与信息系统 陈恭和.
美国数学学会 MathSciNet 电子资源的检索和使用
第一章 函数与极限.
编程作业3:网页正文抽取 (10分).
C语言程序设计 主讲教师:陆幼利.
学习目标 1、什么是字符集 2、字符集四个级别 3、如何选择字符集.
计算机及办公软件应用 ©2013 苏州工业园区职业技术学院
2019/4/16 关注NE官方微信,获取更多服务.
WPT MRC. WPT MRC 由题目引出的几个问题 1.做MRC-WPT的多了,与其他文章的区别是什么? 2.Charging Control的手段是什么? 3.Power Reigon是什么东西?
数据库使用指南 Nature全文数据库.
中国国家标准文献 共享服务平台检索 信息检索与利用 2019/4/29 王婧怡 图书馆615室 科技信息研究所
2019/4/ /4/25 学习科研好助手 NoteExpress文献管理与检索系统 北京爱琴海乐之技术有限公司.
计算机网络与网页制作 Chapter 07:Dreamweaver CS5入门
项目二:HTML语言基础.
成绩是怎么算出来的? 16级第一学期半期考试成绩 班级 姓名 语文 数学 英语 政治 历史 地理 物理 化学 生物 总分 1 张三1 115
iSIGHT 基本培训 使用 Excel的栅栏问题
数据集的抽取式摘要 程龚, 徐丹云.
黎明职业大学图书馆使用指南 1.图书馆概况 2.图书馆布局 3.图书馆提供的服务 4.反对不文明现象.
第八章 总线技术 8.1 概述 8.2 局部总线 8.3 系统总线 8.4 通信总线.
氧化还原反应.
深 圳 职 业 技 术 学 院 SHENZHEN POLYTECHNIC
SpringerLink数据库使用说明 上海师范大学图书馆
GIS基本功能 数据存储 与管理 数据采集 数据处理 与编辑 空间查询 空间查询 GIS能做什么? 与分析 叠加分析 缓冲区分析 网络分析
基于列存储的RDF数据管理 朱敏
新生入馆教育 曲阜师范大学日照校区图书馆 曲阜师范大学日照校区图书馆参考咨询部 1 1.
第十七讲 密码执行(1).
入侵检测技术 大连理工大学软件学院 毕玲.
辞典类 Oxford English Dictionary 牛津在线英语大辞典
Sssss.
Presentation transcript:

第二章 信息检索基本知识 第三节 信息检索与检索系统

第三节信息检索与检索系统 1、信息检索 2、检索系统 3、检索系统的组织

1. 信息检索 信息检索(Iformation Retrieval):将信息按一 定的方式组织和存储起来,并根据信息用户的需 要找出有关的信息的过程和技术。 了解用户的信息需求 满足信息用户的需求 信息检索的技术或方法

文献 数据 事实 1.2、信息检索的对象-----你找谁? 包括题录、文摘和全文。 数值或数据(包括数据、图表、公式等) 某一客观事实为检索对象,查找某一事物发生的时间、地点及过程 例如“关于自动控制系统有些什么参考文献?”这就需要我们根据课题要求,按照一定的检索标识(如主题词、分类号等),从所收藏的文献中查出所需要的文献。 例如,查喜马拉雅山有多高,杭州六和塔建于何年等。 例如:本学年成绩优秀的学生有多少,某同类产品中,那种牌号的销量最大。

信息检索的起源 信息检索起源于图书馆的参考咨询和文摘索引工 作。

广义:信息的储存与检索 狭义:信息的查询 了解用户的信息需求 信息检索技术或方法 满足信息用户的需求 存--取

信息检索的类型 按存储与检索对象 划分 文献检索 数据检索 事实检索 按存储的载体和实现查找的技术手段划分 手工检索 机械检索 计算机检索 按检索途径划分 直接检索 间接检索

2.检索系统 系统 设备或方法 存储 检索 利用一定设备和方法从某种载体上的文献、事实、或数值记录集合中查找所需要信息的系统

信息检索系统的三个要素 人 检索主体 信息资料 检索对象 检索工具 设备

检索系统按功能分类 目录检索系统 馆藏目录、联机公共检索目录(Opac) 文献检索系统 目录检索和文献检索统称为书目检索(二次文 献),提供的信息是文献线索 事实检索系统 包括对事实、数据和全文的检索,是一种直接 的确定性检索。词典、百科全书、年鉴、名录等。

3. 检索系统的组织 手工检索系统 计算机检索系统(数据库) 是指用电子计算机和数据库存储、检索 文献信息资料的系统。 按检索手段划分: 光盘检索 联机检索 网络检索 3. 检索系统的组织 按检索手段划分: 手工检索系统 传统的靠查目录卡片、工具书等来检索的体系,如图 书馆目录体系、工具书检索体系等 计算机检索系统(数据库) 是指用电子计算机和数据库存储、检索 文献信息资料的系统。

按检索对象区分: 数据检索:以数据作为检索对象,查找用户所需 要的数值性数据。 事实检索:以事实作为检索对象,查找用户所需 要的描述性事实。 包括:调查数据、统计数据等。 事实检索:以事实作为检索对象,查找用户所需 要的描述性事实。 包括:机构、企业或人物的基本情况。 文献检索:以文献作为检索对象,查找含有用户 所需信息内容的文献。 数据或事实检索以文献为依托,可视为文献检索 的特例。

按检索要求区分 强相关检索:强调检索的准确性,向用户提供高 度对口信息的检索,也称为特性检索。 弱相关检索:强调检索的全面性,向用户提供系 统完整信息的检索,也称为族性检索。

按检索性质区分 定题检索:查找有关特定主题最新信息的检索, 又称为SDI检索。 特点是:只检索最新的信息,时间跨度小。 回溯检索:查找一段时期内有关特定主题信息的 检索,也称为追溯检索。

二、信息检索类型 按检索的信息形式区分 文本检索:查找含有特定信息的文本文献的检索, 其结果以文本形式反映特定信息. 多媒体检索:查找含有特定信息的多媒体文献的检 索,其结果以多媒体形式反映。

从CNKI(清华同方期刊全文数据库)中查 找: 举例: 题目:查找研究张爱玲的期刊论文 从CNKI(清华同方期刊全文数据库)中查 找: 检索途径 检索词 文章数 示 例 相关度 题名 张爱玲 865 1、纪念张爱玲 2、距离之美——从《倾城之恋》谈张爱玲小说的美感 强相关 全文 6177 1、论晚清上海服饰时尚 2、走近周润发 弱相关

信息检索最关心的问题 1、查全率 2、查准率

影响查全率和查准率的主要因素 (1)对于信息检索系统 A、系统内信息存储不全面,收录遗漏严重 B、词表结构不完善,词间关系模糊或不正确,索引词汇缺乏控制 C、标引不详尽或者标引的专指度缺乏深度,不能精确描述信息主 题 D、组配规则不严密,容易产生歧义 (2)对于信息用户 A、检索课题要求不明确或者不能全面、完整地描述检索要求 B、检索系统选择不恰当 C、检索途径和检索方法单一 D、检索词使用不当或者检索词缺乏专指性、组配关系错误

如何提高查全率? 1.优先使用最简单常用的主题词; 2.逐渐减少不重要的检索词; 3.加用多个等同词,用“或”(OR、|)语法; 4.换用上位词;  5.增加检索途径

如何提高查准率? 1. 换用专指性更强的主题词; 2. 逐渐加用主题词; 3. 加用辅助词; 4. 利用词和网页的外部特征限制输出结果; 5. 观察不相关检索结果的特征,使用“减”(-) 语法排除; 6. 使用下位词

提高检索效果的措施和主要方法 提高检索系统的质量 扩大检索系统数据库中信息资源的收录范围,提高信息资源的质量 检索课题要符合数据库的收录内容 数据库的著录内容要详尽、准确,辅助索引完备,具有良好的索引语言专 指性和较高的标引质量等。  提高用户利用检索系统的能力 用户要具备一定的检索语言知识,能够正确选取检索词和合理使用运算符 完整、准确表达信息需求的主题 灵活运用各种检索技术、检索方法和检索途径 能够结合使用综合性检索系统和专业性检索系统实施跨库检索 制定优化的检索策略,准确地表达检索要求,尝试多次检索,并随着背景 知识的增加不断调整检索策略 采用严谨的科学态度,认真遵循检索操作步骤,预防操作失误,最大限度 地发挥检索系统的作用 根据不同检索课题的需要,合理兼顾和调整对查全率和查准率的要求

信息检索的四个要素 1.信息检索的前提----信息意识 2.信息检索的基础----信息源 3.信息检索的核心----信息获取能力 4.信息检索的关键----信息利用

第四节 文献检索语言 第四节 文献检索语言

一、检索语言的定义 检索语言(Retrieval Language):用于描述检索 系统中文献主题内容特征及外表特征和表达用户 信息提问的一种专门语言。 标引人员与检索人员之间的约定语言 提供检索所需的文献特征

检索语言的分类 检索语言可分为两大类: 检索语言从规范、授控的情况 目前网络检索多用 自然语言 分类法 主题法 人工语言 (规范语言)(artificial language) 自然语言(非规范语言)(natural language) 目前网络检索多用 自然语言

检索语言 题名语言 描述文献外部特征语言 著者语言 标题词语言(SHE) 分类语言 单元词语言 描述文献内容特征语言 主题语言 号码语言(专利号,标准号,报告号等) 描述文献内容特征语言 分类语言 主题语言 标题词语言(SHE) 单元词语言 叙词语言(INSPEC) 关键词语言 分类主题(一体化语言)

二.检索语言——分类法 分类 分类法 以事物的本质属性或其他显著特征作为依据,把各 种事物集合成类的过程。 指将类或组按照相互间的关系,组成系统化的结构, 并体现为许多类目按照一定的原则和关系组织起来 的体系表,作为分类工作的依据和工具。 分类法有交叉分类法,树状分类法等等。 http://baidu.baomihua.com/watch/042114651910 10460056.html?page=videoMultiNeed

分类语言 分类语言 是一种按学科范畴和体系划分事物的检索语言,以 分类表形式体现。 展示了学科的系统性,反映了系统的从属、派生关 系,从上到下,从总体到局部的一种等级体系。 分类语言由类目和相对应的类号来表达各种概念, 构成一个完整的分类类目表。

图书分类法的历史 较早时的分类法:“四库分类法”,从六分法到四 分法。 20世纪以来,一些以现代学科分类为基础的图书 分类法陆续出现。这些分类法考虑了知识的系统 性,按照学科的性质归类。 最有影响的有四种: 《杜威书目十进制》,沈祖荣、胡庆生,1917 《世界图书分类法》,杜定友,1925 《中国图书分类法》, 刘国钧 ,1929 《中国十进分类法及索引》,皮高品, 1934

杜威十进分类法(DDC) Dewey Decimal Classification,DC/DDC 总纲门纲目子目… 000 总论 100 哲学 200 宗教 300 社会科学 400 语言 500 自然科学和数学 600 技术(应用科学) 700 艺术、美术和装饰艺术 800 文学 900 地理、历史及辅助学科

600 技术科学 620 工程学 621 机械工程 .0 工程热力学 .3 电力工程 .31 电力的发生 .38 电子及电力通讯工程 . 384 无线电通讯工程 . 3841 无线电原理

中图法 《中国图书馆分类法》 (原称《中国图书馆图书 分类法》)是我国建国后 编制出版的一部具有代表 性的大型综合性分类法, 也是当今国内图书馆使用 最广泛的分类法体系,简 称《中图法》。

中图法——编制原则 以马列主义毛泽东思想为指导,以科学技术发展水平和文献出版的实际为基础,将科学性、实用性、思想性有机地统一。 以科学分类和知识分类分基础,依照从总到分、从一般到具体、从理论到应用的原则构建逻辑系统。分类体系与类目设置既要保持相对稳定,又要考虑有一定的动态性,及时反映新学科、新主题的发展,并允许对其结构和类目作一定的调整,以满足不同的需要 标记符号力求简明、易懂、易记、易用;标记制度力求灵活实用,有较好的结构性,以揭示体系分类法的本质特征。 兼顾作为编制分类检索工具的规范与作为文献分类排架的规范的双重职能。 兼顾不同类型、不同规模图书馆和文献信息机构类分不同类型文献的需要。

中图法——历史沿革 《中图法》是一部综合性分类表能够供所有学科专业文献 标引和检索使用的标引语言。 《中图法》的前身可追溯 到《中小型图书馆分类表草案》 1957年 《中小型法》1959年《大型法》 1975年《中图法》 1975年10月科学技术文献出版社正式出版《中图法》第一版 1999年3月北京图书馆出版社出版第四版,全称也从《中国图书馆 图书分类法》改为《中国图书馆分类法》 2001年夏北京图书馆出版社出版了第四版的电子版,称为《中国 图书馆分类法》(第四版)电子版1.0版。 2010年《中图法》第五版,以后《中图法》每五年修订一次

中图法的基本结构 中图法以图书学科内容作为分类的主要标准与依据。将图 书在5个基本部类的基础上分为22个大类。 (1)基本部类:中图法分五大类部:马列毛邓;哲学; 社会科学;自然科学;综合性图书。 (2)基本大类:构成分类表的第一级类目。中图法为22 个基本大类,用A—Z表示。 (ABCDEFGHIGKLMNOPQRSTUVWXYZ) (3)简表:由基本大类与由其直接展开的一、二类目所 形成的类目表。 (4)详表:由简表展开的各种不同登记的类目所组成的 类目表,是文献分类的真正依据。

中图法 检索标识即分类号,由字母和数字组成 采用等级列举表达从属关系 上位类目与下位类目的关系: 分类号越长,表示的学科范围越窄。 上位类目一定包含各个下位类目, 下位类目一定带有上位类目的属性。 分类号越长,表示的学科范围越窄。 为了清楚醒目, 通常分类号的第三位数字后,隔以.,如 F279.712(经济类),TQ032.4(化学工程)

基本大类 A 马克思主义、列宁主义、毛泽东思想、邓小平理论 N 自然科学总论 B 哲学、宗教 O 数理科学和化学 C 社会科学总论 P 天文学、地球科学 D 政治、法律 Q 生物科学 E 军事 R 医药、卫生 F 经济 S 农业科学 G 文化、科学、教育、体育 T 工业技术 H 语言、文字 U 交通运输 I 文学 V 航空、航天 J 艺术 X 环境科学、安全科学 K 历史、地理 Z 综合性图书

分类简表 http://lib.wipe.edu.cn/jbxx/ztfl/ztffl.htm

B 哲学 社会科学 自然科学 综合 C 社会科学总论 D 政治、法律 E 军事 F 经济 G 文教、科学、体育 H 语言 J 艺术 I 文学 K 历史、地理 自然科学总论 N O 数理化 P 天文学、 地球科学 Q 生物科学 R S T U 交通运输 V 航空、航天 X 环境科学 Z 综合性图书 医药、卫生 农业科学 工业技术 TB TD TE TF TG TH TJ TL TK TM TN TP TQ TS TU TV 一般工业技术 矿业工程 石油 冶金工业 机械、仪表 武器工业 动力工程 原子能技术 电工技术 无线电、电子学、电讯技术 自动化计算 化学工业 轻工业、手工业 建筑科学 水利工程 金属学 图3 -1 中 图 法 展 开 图

检索语言-分类法-中图法 O 数理化 ……………………… … 一级类目 O1 数学 ……………………… … 二级类目 …… .1 质点运动……… … … 五级类目 O4 物理学 ………………… … 二级类目

举例 《高等数学》 分类号:O13 《磁流体力学》 分类号:O361.3

1.总论复分表 该表编列出各学科门类均可能遇到的共性区分内 容。标记符号以短横“-”与数字符号组成。 –0 理论与方法论 –0 理论与方法论 –1 科学现状、概况 –2 机关、团体、会议 –5 丛书、文集、连续性出版物 –6 参考工具书

总论复分表-例 物理学手册,O4-62 电影艺术词典,J9-61 工程师手册、技术手册,T-62 工业产品目录、样本, T-63

2.地区区分号“()” 当某类目需要依地区、国家区分,但类目无注释 规定可依地区表复分时,则可将“世界地区表” 或“中国地区表”中的有关类号用()括起,加 在主类号之后。 例如:《俄罗斯画家尼古拉·费迅油画作品》 类号:J233(512)=5(各国绘画作品)油画/(世界 地区表)俄罗斯及苏联/(国际时代表)现代

3.民族区分号““”” 如某类目需要依民族细分,但类目无注释,依“世界种族与民族表” 或“中国民族表”复分时,则可将种族或民族号码置于“ ”中,加 在主类号之后。 例1:《犹太人经商智慧》或《犹太人经商秘诀》 类号:F715“382”商业企业组织与管理(类目注释:商业经营管理 学入此。)/(世界种族与民族表)犹太人 例2:《吉普赛舞蹈》 类号:J732.2“510.5”(各国舞蹈、舞剧/各种舞蹈)民族、民间舞 蹈/(世界种族与民族表)吉普赛人(茨冈人) 例3:《吉普赛扑克牌游戏》 (电影《叶塞尼亚》) 类号:G892“510.5”(文体活动)牌类(类目注释:扑克、桥牌、 麻将等入此。)/(世界种族与民族表)吉普赛人(茨冈人)

4.时代区分号“=” 当某类目需要依时代区分,但类目无注释规定可 依时代表复分时,则可将“国际时代表”或“中 国时代表”中的有关类号加在主类号之后,中间 用“=”联结。 例如:《羽坛辣妹子自话》(龚智超的自传) 类号:K825.47=76(中国人物传记)体育人物/( 中国时代表)21世纪

5.通用时间、地点区分号“〈〉” 若某类目需按通用时间、地区复分,则将“通用 时间、地点区分表”的有关类号置于“〈〉”内, 加在主类号之后。 例如:《春季饮食养生》或《春季进补》 类号:R247.1<111>(中医学临床)食养、食疗/( 通用时间、地点表)春

6.组配符号“∶” 用于联结两个相关的主类号,合成一个组配类号 。 例1:《英美名诗汉译集》 类号:H319.4∶I561.2英语读物/组配编号法/文学/ (世界地区表)英国文学/(专类复分表)诗歌 例2:《汉语方言研究文献目录》 类号:Z88∶H17专科目录/组配编号法/汉语方言

标记符号的排列 《中图法》标记符号的排列采用:一般类号由左 至右逐位对比的方法进行升序排列,先比较字母 部分,再比较数字部分。字母部分按字母固有的 次序排列,数字依小数制排列。分类号中如果涉 及多种辅助符号的使用,一般按-、()、“”、 =、〈〉:以及其他的顺序排列。

排列举例 分类号款目排序次序: 总论复分区分符号:- 国家地区区分符号:() 民族区分符号:“” 时代区分符号:= 通用时间、地点区分符号:< > 主类号组配复分区分符号:∶ 其他

分类法的特点 区分不同性质的图书 集中性质相同的图书性质 相近的放在相近的位置 按照远近亲疏的关系把图书组成为一个有条理的 体系 提供从学科分类查找图书的途径。

中图法-索书号(call number) 索书号又称为排架号 反映了某种图书在整个图书组织中的排列次序和 在书库中的具体位置(架位) 组成:分类号+书次号 分类号:按学科分类图书 书次号:同类书的排列

书次号的两种取法: 种次号:按图书到馆的先后顺序给予号码。 著者号:按著者名称(代码)来区分同一分类号下 的不同文献 缺点:会使同一著者的同一类著作排放在不同位置 著者号:按著者名称(代码)来区分同一分类号下 的不同文献

中图法-图书的排架顺序 按索书号排架 先顺序分类号: 再顺序书次号

顺序分类号 对位排列 即先比较一级类号,一级类号相同时,再 比较二级类号,以此类推。 分类号数字的排列,严格按照小数制的排 列方法。 如: O13/245, O175/25, O189.1/2 均排在 O2/56 之前。

同一类分类号中: 先排带横杠后排带点: 带“-”符的排在“0”符之前, H313/1(英语常用词组) H313-44/1(大学英语测试专集)

顺序分类号-例 H31,H313,H313-44,H313.1, …; H315, … ; H316,…; H32,H326,…;H33, …;H336,…

顺序书次号 当分类号相同时,开始顺序书次号 此时要区别种次号和著者号,二者的顺序方法不 同 种次号完全按照阿拉伯数字的顺序排列 著者号则需对位排列

顺序书次号-例 I245.7/35, I245.7/36, I245.7/37,…, I245.7/134,…,I245.7/256,…,(种次号顺序) O6/A124,O6/B123,…,O6/I34,O6/I345,…, O6/Z542,O6/Z554,O6/Z56(著者号顺序)。

分类法特点1 历史悠久,它为文献资料的分类、目录组织及查找等起了 很大作用。从检索角度讲分类法具有以下几个特点: 易于族性检索 按学科分类检索体系反映了事物的隶属关系、派生关 系。族性检索采用检索词的上位词及概念的外延进行 检索,以扩大检索范围。但在从属关系不清楚的情况 下,要查找某一特定内容的命题,则难以入手。 不直观 标识符是用号码来表示具体类目的含义,由编制者人 为规定。只有知道所要查找的文献的类号才有可能找 到所需要的文献。

分类法特点2 编制要求、项目设置相对稳定 造成分类法的发展往往落后于科学的发展, 新概念、新事物不易找到合适的类目 。 学科间互相交叉和渗透,出现各种分支学科及边缘 学科,使一个概念在多个类目下出现,不同的标引 人员会给出不同的类号,造成漏检。 由于分类具有上述三种不利因素,产生了某些检 索上的困难,由此而促使另一种情报检索语言- -主题语言的出现。

1.自然语言 自然语言是取其自然形态,不受控,使用非规范词 (uncontrolled term)或称自由词(free term)。自然语 言极其丰富、复杂和多样,存在着一词多义、多词一义及 词义交叉的现象。常见的有同义词、近义词、同型异义词 等。 自由词有较大的灵活性,使用随意,专指性强,查准率高。 它能及时地反映最新出现的词汇,反映规范词难于表达的 特定概念或新概念。 自然语言的缺点是由于它不规范,缺乏对词汇的控制能力, 也无法指示概念之间的关系,影响到检索效率。

2.人工语言 人工语言(规范语言)(artificial language, controlled language)受信息检索的控制,使用 控制、规范词(controlled term)。 人工语言的规范处理重在两个方面:一是使一个 概念只用一个词汇来表达,这样就避免了多词一 义的情况;二是使一个标引词只能表达一个概念 ,这样就排除了一词多义现象,这时,需要加上 必要的限定和注释。

例如: “飞机”这一概念,用英语检索时,可 用plane , airplane , aero plane , aircraft 等同义词,规范就是选定其中最适合的一个词 汇来标引这一概念, 如果选定aircraft 一词,则其余词均为 非规范词。在使用aircraft规范词来检索时, 其结果将包含所有有关飞机这一概念的文献, 而不管这些文献中是否确切出现过aircraft这 个词。

检索语言-概念 标引 在对文献进行组织管理的过程中给文献赋予 检索标识的过程。 给予分类号的过程称为分类标引; 给予主题词标识的过程称为主题词标引。 检索标识 用来描述文献特征的情报检索符号,检索标 识的种类见图3-1

主题语言 以自然语言为基础 用表达概念的词来提示文献的内容 标识符是文字。 按主题词的字顺编排 如直接使用“金属陶瓷”、“感光材料”、“载重汽车”进行标 引。 按主题词的字顺编排 查找方便、直观 不受学科从属关系的约束 能较好地满足特性检索的要求  

主题词-种类 关键词 单元词 标题词 叙词

主题词种类-关键词(keyword) 直接来源于从文献篇名、正文和文摘 为具有实际意义的词语 关键词法属自然语言 禁用词(stop-term)如冠词,介词,副词等除外 关键词法属自然语言

Aircraft Planes 主题词种类-关键词-问题 同义词标引--引起漏检 例:飞机 Airplane 主题检索体系是按主题词字顺排列的,而用于 标引的关键词呈现出多种字面形式-同义词时, 将使同一主题的文献分散到不同的字顺位置, 使查全率受到影响。 例:飞机 Airplane Aircraft Planes

主题词种类-关键词 多义词标引--引起误检 多义词 cell  电池  细胞 检索词 cell 查找细胞方面的文献 两个完全不同的概念 结果: 电池、细胞两方面的文献 同时被检出 两个完全不同的概念

主题词的规范化 为了避免上述现象,采用规范化的词进行 标引。 规范化,即词和概念一一对应,一个词表 达一个概念

规范化主题词-单元词 词义已是单元概念不可再分 规范词 例:单元词-汽车,温度表,电动机 非单元词-载重汽车  载重工具  汽车

规范化主题词-标题词 一组固定组配的规范化主题词 标题词有两级: 主标题词:表示事物、概念 组配:是指将两个或多个主题概念,按一定的规则复合 起来,以表达一个更专指的主题概念 标题词有两级: 主标题词:表示事物、概念 副标题词:限定修饰主标题词,说明主 标题所涉及的方面 例:计算机科学-发展趋势

规范化主题词-标题词 主标题词除用单个名词或动名词外, 还有下列三种形式: 正叙式 倒叙式 并列式

主题法与分类法比较-检索标识不同 分类法 主题法 检索标识--人为定义的 检索标识--借用自然语言中表达概念的词,直 观易记,便于掌握。 标引文献时,把语言文字所构成的概念转换成号码 检索时,检索者要在号码中找出相当于文字形式的 概念。 主题法 检索标识--借用自然语言中表达概念的词,直 观易记,便于掌握。

例-聚丙烯纤维的生产工艺 例:查找聚丙烯纤维的生产工艺的文献 分类法: 主题法: 首先找到所属的分类号TQ346.2 才能查到相关文献。 一篇聚丙烯纤维生产工艺的文献 标引时,直接用主题词“聚丙烯纤维”及“工艺” 标引。 检索时,只需直接用“聚丙烯纤维”与“工艺”二 个主题词组配检索,就能查到相关文献。

检索标识符的排列方法不同 主题法 分类法 检索标识符按主题词的字顺排列 不受体系约束 增补新词方便 能及时反映学科的发展 检索标识符按类号的逻辑次序排列,即按学科体系排 列, 其体系固定, 难以增补新概念 迟后于学科发展。

揭示事物的角度不同 主题法 分类法 着眼于特定事物 以某一特定事物为中心,揭示与它相关的部分或全部问 题 有利于特性检索。 学科体系为主 研究事物属于什么学科、以及它与其他事物间的相互关 系 利于族性检索。

对文献的集中与分散的角度不同 主题法 分类法 同一主题的文献集中在一个标题下 同一学科的文献分散在不同的标题中 同一学科的文献集中在一个类目下 同一主题的文献分散在不同的类目中 特别因学科发展而引起的相互渗透,使有些文献 很难放在一个学科内。

例-化学分析 主题法 分类法 在“化学分析”这一主题下,集中了所有“化 学分析”的文献, “化学分析”这一主题的文献被分散在各学科 中,如在“金属学”“分析化学”“农业化学” “原子能技术”……等学科领域中都可能有“化 学分析”文献。

对于专指的主题的揭示不同 主题法 采用概念的组配或概念的提级来表达主题。 分类法 不能组配标引 对专指的主题概念只能提级标引表达

例-标引有关“聚丙烯纤维”方面的文献 主题概念--聚丙烯纤维 分类法 主题法 只能标到分类号“TQ 346.2” 而关于聚丙烯纤维的各个研究方面无法细分 需表达其各个研究方面时,只能提级仍以TQ 346.2标引。 主题法 可采用“聚丙烯纤维”与“工艺”,“加工成型” “性质测试”“聚合”等词组配以获得更专指的概念。  

主题词字顺排列,所以前后主题词之间往往是孤 立的,不能表示学科体系的从属关系、不能显示 前后词之间的内容上的联系。 例“双联开关”这个主题词在主题词表中存在,但 该词的前一词是“双联炼钢”,后一个词是“双列 杂交”。这三个彼此相邻的词在内容上是毫无联系 的。这种排列法相对于分类法讲,其族性检索就差 一些了。

主题词法与分类法的比较

作业一: 1、检索语言有哪两大类?有什么异同? 2、我国现行的《中图法》全称是什么?是第几 版的?中图法22个大类是什么?