第三章 主题标引的 一般原则与步骤.

Slides:



Advertisements
Similar presentations
Lib.ujs.edu.cn 信息检索与利用 叙词语言 张壬 lib.ujs.edu.cn 信息检索与利用 主要内容 叙词语言的概念 叙词语言的应用 中国中医药学主题词表及其应用 叙词语言的优缺点.
Advertisements

第五章 特征词 特征词的含义、类型与作用 特征词的含义、类型与作用含义类型作用含义类型作用 特征词标引规则: 特征词标引规则:  人类和动物 人类和动物  具体动物名称特征词 具体动物名称特征词  男性和女性 男性和女性  妊娠 妊娠  年龄组 年龄组  研究类型特征词 研究类型特征词 
2.8 函数的微分 1 微分的定义 2 微分的几何意义 3 微分公式与微分运算法则 4 微分在近似计算中的应用.
博士人员科研答辩   答辩人: 答辩日期:.
WINTER Template 如何标引关键词 数字资源运营中心 高蝴蝶
The Graduation Thesis Defense
《解析几何》 乐山师范学院 0 引言 §1 二次曲线与直线的相关位置.
XXXX学院2014年度 本科教学工作总结 2015年1月15日.
人大复印资料全文数据库 人大复印资料全文数据库选辑1995年至今公开发表的人文科学和社会科学中各学科、专业的重要论文和重要动态资料的全部原文。其信息资源覆盖了人文科学和社会科学领域国内公开出版的3000多种核心期刊、专业期刊和报纸,分4大类100多个专题。
中国生物医学文献数据库(CBM).
第三讲文献检索语言2.
姓 名 出生年月 所在学科 最高学历/位 专业 毕业学校 成果内容 本人业绩 (一)教学内容
第三章 数据类型和数据操作 对海量数据进行有效的处理、存储和管理 3.1 数据类型 数据源 数据量 数据结构
北京协和医学院 博硕学位论文库
《高等数学》(理学) 常数项级数的概念 袁安锋
1.1.3四种命题的相互关系 高二数学 选修2-1 第一章 常用逻辑用语.
常用逻辑用语复习课 李娟.
糖尿病流行病学.
会计学专业基础课堂之 基础会计(初级会计) 安徽财经大学会计学院.
第四次大作业 登陆学校图书馆网站的电子数据库
内科护理学实验 1 血糖的监测与护理 实验学时:4学时 实验类型:综合性.
PRESENTED BY OfficePLUS
第一节 旅游规划的意义和种类 第二节 旅游规划的内容 第三节 旅游规划的编制 第四节 旅游景区规划
如何使用CiteSpace分析Derwent专利数据
Harvard ManageMentor®
面向对象建模技术 软件工程系 林 琳.
R in Enterprise Environment 企业环境中的R
管理信息结构SMI.
单元解析:教材主编 牛长清.
以ISI平台为例,为您演示一下如何在Endnote文献中查看该文献的References
Harvard ManageMentor®
第二章 Java语言基础.
信息检索与利用 江苏大学图书馆 lib.ujs.edu.cn MeSH主题词表及应用 张壬
免费资源PubMed介绍 南方医科大学 顾萍 May 25, 2005.
整合思维导图的初中英语教学设计 主讲人:卢璐.
ScienceDirect高级检索功能及使用视频、说明发现路径
美国数学学会 MathSciNet 电子资源的检索和使用
CiteSpace 简介及应用.
ScienceDirect高级检索功能及使用视频、说明发现路径
请在此位置添加你的论文名称 指导老师:PPT教授 报告人:清风素材.
C语言程序设计 主讲教师:陆幼利.
PubMed的MeSH词检索 及百链数据库检索
ASP New and other UIs: Medical Videos Searchasaurus
计算机及办公软件应用 ©2013 苏州工业园区职业技术学院
论文答辩PPT模板 答辩学生:橘子皮 指导老师:PPT工作室.
WPT MRC. WPT MRC 由题目引出的几个问题 1.做MRC-WPT的多了,与其他文章的区别是什么? 2.Charging Control的手段是什么? 3.Power Reigon是什么东西?
数据库使用指南 Nature全文数据库.
中国国家标准文献 共享服务平台检索 信息检索与利用 2019/4/29 王婧怡 图书馆615室 科技信息研究所
2019/4/ /4/25 学习科研好助手 NoteExpress文献管理与检索系统 北京爱琴海乐之技术有限公司.
项目二:HTML语言基础.
中国风背景论文答辩模板 某大学某某信息学院 答辩学生:代用名 指导老师:代用名 答辩时间:201X年1月30日
成绩是怎么算出来的? 16级第一学期半期考试成绩 班级 姓名 语文 数学 英语 政治 历史 地理 物理 化学 生物 总分 1 张三1 115
Harvard ManageMentor®
双语例句搜索 句库+巨酷 Web: Beijing 2008.
第八章 总线技术 8.1 概述 8.2 局部总线 8.3 系统总线 8.4 通信总线.
目录 01 选题背景和意义 02 论文结构 03 研究方法 04 分析讨论 05 主要结论 06 参考文献.
海报题目 简介: 介绍此项仿真工作的目标和需要解决的问题。 可以添加合适的图片。
深 圳 职 业 技 术 学 院 SHENZHEN POLYTECHNIC
SpringerLink数据库使用说明 上海师范大学图书馆
GIS基本功能 数据存储 与管理 数据采集 数据处理 与编辑 空间查询 空间查询 GIS能做什么? 与分析 叠加分析 缓冲区分析 网络分析
第六章 Excel的应用 五、EXCEL的数据库功能 1、Excel的数据库及其结构 2、Excel下的数据排序 (1)Excel的字段名行
基于列存储的RDF数据管理 朱敏
XX大学XX学院 多色复古论文答辩PPT模板 X124-2 蓝梦 学号.
论文题目写在这里 题目太长分两行写也可以哦 - 国际经济与贸易 指导老师
第三节 数量积 向量积 混合积 一、向量的数量积 二、向量的向量积 三、向量的混合积 四、小结 思考题.
第十七讲 密码执行(1).
RefWorks使用指南 归档、管理个人参考文献.
§2 自由代数 定义19.7:设X是集合,G是一个T-代数,为X到G的函数,若对每个T-代数A和X到A的函数,都存在唯一的G到A的同态映射,使得=,则称G(更严格的说是(G,))是生成集X上的自由T-代数。X中的元素称为生成元。 A变, 变 变, 也变 对给定的 和A,是唯一的.
Sssss.
海报题目 简介: 介绍此项仿真工作的目标和需要解决的问题。 可以添加合适的图片。
Presentation transcript:

第三章 主题标引的 一般原则与步骤

前言 主题标引是建立文献检索系统的关键环节。标引工作的质量取决于3个基本条件: 标引员本身的业务素质、知识结构与学科背景知识; 良好的词表系统; 严格的标引规则和正确的标引步骤。

前言 标引规则是指标引人员必须共同遵守的工作守则,目的是确保文献标引的准确性、一致性和连贯性。 受控情报检索语言的标引规则既复杂又详细,包括组配规则、选词规则、一般规则和各类医学文献标引规则等。

前言 主题标引的步骤是指标引工作流程。 遵循正确的标引步骤并掌握标引方法,对保证和提高标引质量十分重要。 本章讲述医学文献主题标引的基本流程 。

标引的一般原则 1. 客观性原则: 标引在手文献:“在手”文献是指标引人员要亲眼见到需要标引的文献才进行标引。标引不能仅根据文献的题目,而要从文章的摘要、引言、结论甚至全文中获取足够的信息。 忠实于原文:“Indexer is only indexer” 标引人员无权对文献妄加猜测和评论,不能掺杂个人观点。结果或结论必须有事实依据。

标引的一般原则 2. 专指性原则 主题词有明确的等级性。标引时要根据文献的内容选用专指主题词,从词表中选择与文献内容最匹配的主题词。 如:标“高血压,肾性”,不要标“高血压” 在采用副主题词时,也应依据副主题词树状结构的分级选择最专指的副主题词标引。 如:标“高血压/药物疗法”,不要标“高血压/治疗”

标引的一般原则 3. 一致性原则 是保证检索系统查全率、查准率最基本的条件之一。对于内容相同的文献,同一标引员在不同的时间,不同的标引员在同一或不同的时间均应力争保持一致。这样才能使同类主题词的文献集中在检索系统的同一主题之内。

标引的一般原则 4. 全面性原则 标引人员在标引某篇文献时,分配主题词应尽量全面反映文献各个方面的内容,以保证检索者能从各自的专业角度检索到这篇文献。 如“儿童糖尿病肝内葡萄糖代谢”:儿童、糖尿病、肝、葡萄糖、代谢 尤其要注意对文献中讨论到的阴性结果的标引。 如“实验性药物对交感神经的影响”,结果阴性,且在文章内进行了讨论,仍应标引。

标引的一般原则 5. 符合性原则 符合性是一致性的基础 选用的主题词必须是词表的主题词,书写形式、字母拼写等要与词表一致 遵守标引的各项规则:组配、选词 选用的主题词在词义上应与文献概念一致

标引步骤 文献主题分析,提炼主题概念 查表选词,转换主题概念 填写标引单并审核 标引深度的控制 IM与NIM的判别

文献主题分析 是主题标引过程的初始环节和重要基础,是整个标引过程的关键。 主题分析内容: 文献审读 主题分析 主题概念的提炼(隐含主题概念) 主题类型的确定 主题结构的分析 返回

文献主题分析—文献审读 论文结构:题目、摘要、关键词、引言、材料和方法、结果、分析和讨论、结论、参考文献 认真阅读并理解篇名 阅读引言部分 文章目的 逐段浏览文章,注意标题 逐段阅读讨论部分,明确文献重点主题 阅读结论 浏览材料和方法部分 特征词 浏览文末参考文献 参阅作者所给的关键词

文献主题分析—文献审读 应带着以下问题进行审读: 该文献的主要论点是什么? IM 次要论点是什么? NIM 哪些主题真正讨论?仅仅提及? 杂志的专业类型? 该文献主题概念专指?泛指? 结论是否作者的猜测和推论? 要标引的概念是否掺杂了标引者的个人褒贬?

文献主题分析—主题概念提炼 对一篇文献提炼主题概念的多少要恰到好处,不要提炼过多、不全或错误。 文献中概念可分3个等级: 如“糖尿病的饮食治疗”提炼出“糖尿病的治疗” 文献中概念可分3个等级: 第Ⅰ级概念:文章主要论点 IM 第Ⅱ级概念:文章讨论的次要方面 NIM 第Ⅲ级概念:文章仅仅提到,未讨论。不需要标引

文献主题分析—主题概念提炼 隐含概念的分析:隐藏在主题中的概念易被忽视 如:“为乳腺癌服务的工作组织” 隐含着“癌监护组织”这一概念。 “烟囱排烟” 隐含着“烟对环境污染”的概念。

文献主题分析—主题类型 单主题 单元主题 主题类型 复合主题 多主题(并列主题)

文献主题分析—主题类型 单主题:一篇文献论述的对象和问题只有一个,即只有一个主题 单元主题:由一个概念单元,即一个主题词就可以表达的主题。 如《生理学》等书 复合主题:一篇文献的主题必须由几个概念单元进行逻辑组配才能表达或描述的一种主题。一般需选用几个主题词(含主题词/副主题词组配)进行描述或表达。 如:“胃肠瘘”这一主题,要由“胃瘘”、“肠瘘”两个主题词进行组配

文献主题分析—主题类型 多主题:一篇文献所研究的对象或论述的对象不止一个,而是几个具有并列关系的对象,即几个相互并列独立的主题。分析时必须把多主题解析为一个一个的单主题。 如:“激光在医学和生物学上的应用” “激光在医学上的应用” “激光在生物学上的应用”

文献主题分析—主题结构 主题结构:构成某一主题的几个概念的构成形式和相互关系。构成某一主题的每个概念 主题因素。 主题结构:构成某一主题的几个概念的构成形式和相互关系。构成某一主题的每个概念 主题因素。 主题分面结构模式:依据主题词在主题中的不同地位和作用划分。在医学文献主题标引中,将MeSH表和《中医药学主题词表》中的主题词归纳为4个范畴面。

文献主题分析—主题结构 1. 主体面:词表中具有独立检索意义的主题词,除另3个面之外的主题词 例:电针对脑血栓形成患者微循环的影响 2. 通用面:副主题词 例:氯丙嗪引起粒细胞缺乏症

文献主题分析—主题结构 3. 特征面:全部特征词(对象特征、时代、出版类型) 4. 位置面:Z、N4类,中医TZ、TN3类 如:儿童白血病 清代中药半夏的炮制方法 关于高血压治疗的综述 4. 位置面:Z、N4类,中医TZ、TN3类 如:上海甲型肝炎大流行 返回

标引深度及其控制 标引深度:简单地说是指对一篇(种)文献所赋予的全部检索标识的数量。 从广义来说是指标引工作中对一篇文献的各种内容特征和外表特征进行分析、描述所达到的深度,包括赋予的主题词、分类号、书名、著者等检索标识; 从主题标引角度来说,标引深度指标引文献平均所用主题词的数量。

标引深度及其控制 在用词准确的基础上,标引深度对文献的检索效率(查全率、查准率)有很大影响。 标引深度要适中。过深意味着: 用更多主题词标引文献,将增加每个主题词所集中的文献数量,与文献主题无关的主题词出现的机会就越大,导致检索“噪音”增加,降低查准率。 增大标引工作量,增加数据库的储存量或检索工具的篇幅,增加经济成本。

标引深度及其控制 确定怎样的标引深度,考虑: 根据本单位性质、任务、人力、物力条件来规定。 依据不同的检索方式来定。机检要求比手检更高的标引深度。 根据文献类型和期刊的级别不同来定。一般,权威性期刊、专业性较强的基础学科文献要求更高的标引深度。

标引深度及其控制 美国MEDLARS和我国TCMLARS标引深度的控制: 二者均为大型综合性的检索系统,手检和机检兼容,有深度标引和非深度标引两级处理。

标引深度及其控制 深度标引:对每篇文献的内容做完全的标引(全面标引),标引每篇文献的主要论点、次要论点,即第Ⅰ、Ⅱ级概念均作标引。 基础医学期刊、国家级核心期刊 非深度标引:是相对于深度标引选用主题词较少的一种标引方式,仅标引文章的主要论点,次要论点可以不标。 临床期刊、中国省市级期刊

标引深度及其控制 “三原则”:要标引多项同类因素时,原则上3种以内的同类因素可一一标引,而4种以上的则用上位概念主题词标引(IM),并选择同类因素中较重要的标引2-3种(NIM)。 如:副主题词、微量元素、生化指标、多种疾病、综合征、肿瘤组织学类型、肿瘤联合化疗方案 多种氨基酸:氨基酸类(IM)+ 3种以内专指的氨基酸 题名上列举的主题因素即使超过3种,原则上也须全部标引。 返回

查表选词 转换主题概念 转换的种类: 直接转换:单元主题 分解转换:复合主题、多主题 “葡萄球菌的感染” 葡萄球菌感染 查表选词 转换主题概念 转换的种类: 直接转换:单元主题 “葡萄球菌的感染” 葡萄球菌感染 “汽车压死行人” 事故,交通 办公室吸烟对他人有害 吸烟污染 分解转换:复合主题、多主题 “胃十二指肠结肠瘘” 子概念:胃瘘 十二指肠瘘 结肠瘘 主题词:胃瘘;十二指肠疾病;肠瘘;结肠疾病

查表选词 转换主题概念 查表选词的基本规则: 必须选取《医学主题词表》和《中医药学主题词表》中的规范化主题词,书写形式应与词表的完全一致。 查表选词 转换主题概念 查表选词的基本规则: 必须选取《医学主题词表》和《中医药学主题词表》中的规范化主题词,书写形式应与词表的完全一致。 必须首先选用与原文献主题概念相对应的最专指的主题词。

查表选词 转换主题概念 如果词表中没有相应的专指主题词表达原文献概念,则应选用与该主题概念最直接相关的几个主题词,或主题词/副主题词进行概念组配表达。 如果主题概念没有恰当的主题词或副主题词组配表达时,可用密切相关的上位词或靠近义词标引。如用“嗜铬细胞瘤”表达“假性嗜铬细胞瘤”。 返回

IM(*)与NIM词的判别 判别标准: 反映文章的主要论点或作者研究的目的作IM词,次要论点作NIM词。

IM(*)与NIM词的判别 判别标准: 成对的组配词(如器官和疾病),一般情况下,若一个是IM词,另一个也是IM词;一个是NIM词,另一个也是NIM词。如胆囊管疾病:胆囊(IM)+胆管疾病(IM) 实验研究的技术或实验室技术(文中曾讨论过)作NIM词,但如果这种技术是文章重点,则做IM词(如题名中的技术)。 越是专指的主题词,IM词的可能性越大;越是泛指的主题词,NIM词的可能性越大。

IM(*)与NIM词的判别 IM词和NIM词的常用概念小结: IM词 1.文章主要论点 2.器官、疾病、疗法、物质、生理过程 3.兽医动物 4.不同年龄组的器官、疾病、疗法、技术、生理过程 5.主题本身 NIM词 文章次要论点,辅助论点 技术(如有讨论) 实验动物 年龄组本身 主题的限定词、检索参词

IM(*)与NIM词的判别 例1 婴儿的心脏功能 心脏/*生理学;婴儿(特征词即NIM词) 例2 儿童阑尾炎 *阑尾炎;儿童(特征词) 例1 婴儿的心脏功能 心脏/*生理学;婴儿(特征词即NIM词) 例2 儿童阑尾炎 *阑尾炎;儿童(特征词) 例3 专科医院的统计学 医院,专科/*统计学和数值数据 例4 巩膜疾病 *巩膜;眼疾病 例5 胃的电生理学 胃/*生理学;电生理学 返回

填写标引单并审核 标引工作单是标引人员对标引的文献所作的记录,内容包括著录项目(作者、页码、题名等)、特征词及主题词等。每篇文献使用一张工作单。 实现计算机辅助标引后,标引人员直接在计算机上实现每篇文献各个项目的标引。 审核是主题标引的最后一道工序,也是保证主题标引质量的一个重要措施。通常不由标引人员来做,而由专门的更高级的专科人员承担。 返回