Presentation is loading. Please wait.

Presentation is loading. Please wait.

医学文献检索讲座 广东医学院 文献检索教研室 钟伟金 2012.4.

Similar presentations


Presentation on theme: "医学文献检索讲座 广东医学院 文献检索教研室 钟伟金 2012.4."— Presentation transcript:

1 医学文献检索讲座 广东医学院 文献检索教研室 钟伟金

2 讲座的目的 增强文献信息检索与利用的意识; 掌握文献信息检索与利用的基本方法; 了解常用的资源数据库; 为继续学习和终生学习打下良好的基础。

3 讲座内容 为什么要学医学文献检索 文献检索的基础知识 文献检索的过程与技巧 常用数据库资源介绍 结束

4 学习文献检索的意义 文献检索在科研中的作用 这是一个信息爆炸的时代 医学工作者面对的信息环境

5 文献检索在科研中的作用 据美国科学基金会统计,一个科研人员花费在查找和消化科技资料上的时间需占全部科研时间的51%,计划思考占8%,实验研究占32%,书面总结占9%。由上述统计数字可以看出,科研人员花费在科技出版物上的时间为全部科研时间的60%。 ----美国科学基金会 NSF(National Science Foundation)

6 被称之为“最牛本科生” 武汉科技大学大三本科生, 周彪等、张腾、徐幼平三人的科研小组。 在核心期刊上发表 10余论文。
受邀参加国际学术会议。 学校拨款设立专属实验室。

7 他们成功的经验 他们的指导老师吴建星副教授认为: 周彪三人虽然仅是大三本科生,但都很有头脑,善于积极主动思考问题,查阅资料、做实验都很认真。

8 医学类文献的特点 1.数量庞大:医学文献占整个科技文献的25%。 2.载体多样化:除印刷型外,还有音频、视频等。
3.语言障碍增加:在医学文献中英语的占了70%。 4.重复发表、学科交叉与出版分散。 5.知识信息更新加快 :大学生毕业后10年在学校学的知识80%以上是陈旧过时的。 6.时滞问题严重

9 不同学科研究人员平均年阅读文献数量 引自

10 不同学科研究人员阅读文章所用时间分/篇 引自

11 引自田纳西大学Carol Tenopir的研究报告

12 文献检索的基础知识 什么是文献检索 文献检索语言 文献检索的资源类型 文献检索的基本技术

13 文献检索的概念 文献检索:指从文献信息集合中查找所需文献或文献中包含的信息内容的过程 广义的文献检索包括存贮和检索两者的过程和技术

14 对文献检索过程的理解

15 对文献检索的理解 文献检索不仅仅是获取全文。 是一个积累的过程:数据库的选择、关键词的选用、检索语法的使用等,要不断总结;
是一个习惯的过程: 文献的阅读也需要技巧,不能大而全,要建立个人文献数据库; 是一个良性循环过程:如何从文献检索中获得自己的思路,如何应用到专业研究中去,又如何回到文献检索中来,如何有所突破。

16 信息资源的类型 1、按文献内容的加工深度分 2、按出版类型划分

17 信息资源的类型 按文献内容的加工深度可分为: 一次文献: 原始文献,是以作者本人的工作经验、观察或实际科研成果为依据而创作的具有一定发明创造或一些新见解的文献。如期刊论文、学位论文、研究报告、专利说明书等 . 二次文献:二次文献是对一定范围、时间或类型的大量一次性文献按其特征收集整理、压缩、加工,并按一定顺序组织编排、用于检索查找利用这些文献而编制的文献。例如:目录、索引、文摘

18 3. 三次文献 综述是指就某一时间内,作者针对某一专题,对大量原始研究论文中的数据、资料和主要观点进行归纳整理、分析提炼而写成的论文。 综述,专题性强,涉及范围较小,具有一定的深度和时间性,能反映出这一专题的历史背景、研究现状和发展趋势,具有较高的情报学价值。 4. 零次文献 零次文献指未经正式发表或未进入社会交流的最原始的文献。如书信、手稿、笔记等,也可是科技人员的口头交流。

19 按出版类型划分 图书 期刊 资料

20 图书(Book) 是对已发表的科研成果、生产技术和经验的总结性的概括论述。系统论述一个专题,内容比较成熟定型。正式出版的图书,均冠有ISBN号 供读者阅读的书籍: 如教科书、参考书、专著等 供读者检索参考之用的工具书: 如字典、百科全书、年鉴等

21 期刊(Periodical) 是一种定期或不定期的连续性出版物,每期版式基本相同,有固定的刊名,有连续的年、卷、期号。正式出版的期刊也有国际标准连续性出版物编号ISSN 如:杂志、学报、通报、综述与述评、索引、文摘等

22 核心期刊 核心期刊:刊载某学科文献密度大、载文率、被引用率及利用率较高,深受本学科专家和读者关注的期刊中的精华。 我国评价期刊的常用工具:
《中文核心期刊要目总览》(北大出版社)、 《中国科技期刊引证报告》(中国科学技术信息研究所)、 《期刊引文报告》(JCR)(Thomson科技公司 )

23 IF(影响因子)=即某期刊前两年发表的论文在统计当年的被引用总次数除以该期刊在前两年内发表的论文总数。
世界著名的期刊: 《Science》29、《Nature》34 、《Cell》31 、《The Lancet(柳叶刀)》30

24 资料(Material) 专利文献 科技会议文献 科技报告 学位论文 政府出版物 标准文献 产品资料 技术档案

25 检索语言类型 检索语言 描述文献 描述文献 外表特征 内容特征 分类语言 作者(地址) 主题语言 出处 序号 文献类型 代码语言 原文语种
题名 作者(地址) 出处 序号 文献类型 原文语种 描述文献 内容特征 分类语言 主题语言 叙词 关键词 代码语言 检索语言

26 描述文献内容特征检索语言 分类语言 代码语言 Classification 规范化的人工语言 Code 按文献内容所属学科分门别类进行
组织,由总到分、由一般到具体。 由简单到复杂一个大类产生许多子 类目,子类目向上层层隶属,向下 级级派生,形成一个严谨有序的直 线型等级分类体系。 代码语言 Code 代表某种意义的符号标识系统 规范化的人工语言 直接体现知识分类体系各级类目的符号标识系统, 分类语言的标识是学科分类号——用分类号来表达各种概念及其等级关系。 规范化的人工语言

27 对概念进行严格的词义限定、词形规范、词类规范,具有概念组配和词间语义关系显示功能。
主题语言--关键词 Key Words 直接从文题、文摘中抽取出的具有实质意义,表达主要内容、起关键作用的词语。 主题语言--叙词 Descriptors 对概念进行严格的词义限定、词形规范、词类规范,具有概念组配和词间语义关系显示功能。 非规范化的自然语言 规范化的人工控制语言

28 分类检索语言 分类检索语言:用分类号作为语言来表达各种概念。按学科、专业集中文献,从知识分类的角度揭示多种不同文献在内容上的区别和联系,提供以学科分类为出发点的文献信息检索途径。 常用的分类法: 美国国会图书馆图书分类法 杜威十进分类法 国际十进分类法 中国图书馆分类法 国际疾病分类

29 《中国图书馆图书分类法》五大部类 马克思主义、列宁主义、毛泽东思想 A 马克思主义、列宁主义、毛泽东思想 哲学 B 哲学 社会科学 自然科学
R 医药卫生 综合性图书 Z 综合性图书

30 社会科学类 自然科学类 N 自然科学总论 O 数理科学和化学 C 社会科学总论 P 天文学、地球科学 D 政治、法律 Q 生物科学 E 军事
R 医药卫生 S 农业科学 T 工业技术 U 交通运输 V 航空、航天 X 环境科学、劳动保护科学 C 社会科学总论 D 政治、法律 E 军事 F 经济 G 文化、科学、教育、体育 H 语言、文字 I 文学 J 艺术 K 历史、地理

31 R 医药卫生 R1 预防医学、卫生学 R2 中国医学 R3 基础医学 R4 临床医学 R5 内科学 R6 外科学 R75 皮肤病学与性病学

32 图书分类的体系结构 R 医药、卫生 (第一级类目) R5 内科学 (第二级类目) R56 呼吸系及胸部系统疾病 ...(第三级类目) R563 肺疾病 (第四级类目) R563.1 肺炎 (第五级类目)

33 举例:检索鹦鹉热病毒的文献 R 医药、卫生 R3 基础医学 R37 医学微生物学(病原微生物学、病原细菌学) R374 致病重要病毒

34 计算机文献检索的基本技术 1.布尔逻辑检索(Boolean searching) 布尔逻辑运算符主要有三种: 逻辑“与”(AND)
逻辑“或”(OR) 逻辑“非”(NOT)。 2.截词检索和通配检索 3.位置运算符

35 1、布尔逻辑算符检索 逻辑“与” “AND” 这是具有概念交叉关系和限定关系的一种组配。A AND B 表示检索的文献必须同时包含A和B两个检索词才能算命中,即图中黑色部分。其作用是缩小检索范围,提高查准率。 如:检索维生素C治疗中腔溃疡方面的文献 检索式:维生素C and 口腔溃疡 维生素 C 口腔溃疡

36 逻辑“或” “OR” 这是属于概念并列关系的一种组配。A OR B表示检出含有检索词A或检索词B或同时包含检索词A和B的文献,即图中阴影部分。其作用是扩大检索范畴,提高查全率。 维生素 C 抗坏血酸

37 逻辑“非” “NOT” 这是概念包含关系的一种组配,是从原检索范围中排除一部分。A NOT B表示在含检索词A的文献中,去掉含检索词B的文献。即去除图中三者相交的部分。去除老年后的黄连素与腹泻相交部分为正确的结果。 例:非更年期妇女内源性雌激素减少与冠心病发病的关系 检索式: (雌激素减少 AND 冠心病) NOT更年期妇女 非更年期妇女 雌激素减少 冠心病

38 举例 硝黄散联用小剂量红霉素治疗新生儿便秘的疗效观察 (硝黄散 or 红霉素) and 便秘
( ) >not > and >or

39 截词算符与通配符 截词算符和通配符在不同的检索系统用不同的符号,一般为:“*” “?”“#”“$”。截词算符(*)代表若干字符有无,表示词根相同但词尾不同;通配符(?)表示一个字符有无。 例:wom?n可以检索到包含woman、women、womyn、womin等单词的文献;Comput*对Computer、Computing、Computation 等以Comput 开头的单词进行搜索。 作用:避免漏检,避免多次输入麻烦

40 位置算符 (1)(W) 即 with: A WITH B 表示在此算符两侧的检索词必须同时出现在同一个字段中。有的数据库要求保持输入A和B两词的顺序不能颠倒,如“冠心病 WITH 高血压”;有的数据库无须保持原有顺序,如“高血压 WITH 冠心病” 。

41 (2)(N) 即 NEAR:强调在此算符两侧的检索词,必须同时出现在同一字段的同一个句子中间。检索词无须保持原有前后次序,检索词与检索词之间可以插入几个单词。 如:急性白血病,有 急性粒-单核细胞白血病 L1急性淋巴细胞白血病 HTLV-I相关急性T细胞白血病淋巴瘤 可以表示为:急性(N)白血病

42 字段限定符检索 (1)“in”表示将“in”左侧检索词限定在字段名内查找。 如:Hypertension in TI
(2)“=”、“<”、“>” 、“>=” 、“<=” 符号主要用于PY字段,限定查找年代。 PY=2005 PY≤2000 PY>1978 (3) “=”还用于限定文献类型,如: PT=Review 文献类型为综述

43 检索文献的基本原则:“四先四后” 先近后远: 先查最近,后追溯既往; 先内后外: 先查国内,后查国外;
先专业后广泛: 先查本专业,后查综合性; 先综述后单篇: 综述文献对课题的历史现 状及存在的争议和展望, 有较全面的论述。

44 (一)检索的基本原理 原理:检索者将检索提问标识与存储在检索工具或检索系统中的文献特征标识进行比较,相一致的则从检索工具或检索系统中输出。
标 题:老年股骨颈骨折经皮折断式螺钉介入性治疗 著 者:魏仲理; 陈毅敏 著者单位:诸暨市枫桥医院放射科 出 处:中外医用放射技术 ; (4): 58-59 主题词:*骨折固定术, 内; 股骨颈骨折/*外科学 特征词:老年人; 人类 例如:查找关于“股骨颈骨折介入治疗”的文献。 检索提问标识:股骨颈骨折 AND (介入治疗 OR 介入疗法)

45 检索过程

46 分析主题,明确检索要求 在分析过程中需要明确学科或专业的范围,弄清检索的真正意义以及实质。 主要包括三个方面的内容:
1. 明确检索目的。检索是为了寻找思路,还是为了了解学科的最新进展等等。 2.所需信息的类型:查找全文、摘要、题录信息,还是查找文本、图象、声音信息。 3.查询的范围:检索范围主要是指地域范围、时间范围、语种限定、网页深度、文件大小限定等。

47 选择数据库具体要注意 要根据检索课题的内容范围和要求来选择数据库,主要包括: (1) 数据库的类型是否满足检索需要。
(2) 数据库的学科专业范围是否相吻合。 (3) 数据库收录的文献类型、文献存贮年限、更新周 期是否符合检索需求。 (4) 数据库对文献的描述程度、标引深度、专指度如 何等,是否按标准化著录。 (5) 数据库提供的检索入口是否与检索课题的已知线索 相对应。 (6)权威性?

48 提取检索词 确定检索词的基本准则: 1、必须能正确反映检索要求; 2、必须符合数据库的检索用词规则; 3、优先选用具有检索意义学科名词术语;
4、多选常用的基本词汇进行组配。

49 提取检索词要注意的问题 1、注意同义词的现象 2、注重口头语与书面语的转换 3、注意词义的重叠性 4、使用上位词 5、不使用虚词
6、注意中西翻译的差别 7、少用无法定性定量的词 8、选用反映实质主题概念的词 9、不使用过长的词组 或短语

50 选择检索入口 题名检索途径 文献外部特征 著者检索途径 引文检索途径 分类途径 主题词途径 关键词途径 文献内部特征 摘要途径 任意词途径

51 检索式及其构建 检索式是检索系统能够理解和运算的查询串,由检索词、逻辑运算符、搜索指令(搜索语法)等构成。检索词是检索式的主体,逻辑运算符和搜索指令根据具体的查询要求从不同的角度对关键词进行搜索限定 。

52 检索:头孢菌素钠Ⅴ和/或磺胺甲噁唑治疗呼吸道感染的引起的副作用研究(P.28)
检索式:((头孢菌素钠Ⅴ OR 磺胺甲噁唑) AND 呼吸道感染) AND 副作用 这个典型的检索式所表达的逻辑意思是: ((头孢菌素钠Ⅴ OR 磺胺甲噁唑)是第一层; ((头孢菌素钠Ⅴ OR 磺胺甲噁唑) AND 呼吸道感染)是第二层; ((头孢菌素钠Ⅴ OR 磺胺甲噁唑) AND 呼吸道感染) AND 副作用是第三层。

53 检索式的构建实例 1、一般性检索 有关老年痴呆的文献 检索式:老年痴呆 2、一般性检索 头针治疗老年痴呆的文献
检索式:头针 AND 老年痴呆 3、全面检索 有关老年痴呆的文献 检索式:老年痴呆 OR 早老性痴呆 OR 阿尔茨海姆氏病 4、全面检索 有关头针治疗老年痴呆的文献 检索式 :头针 AND (老年痴呆 OR 早老性痴呆 OR 阿尔茨海姆氏病)

54 造成检索结果不如意的原因 1.工具和检索系统本身的问题
比如说,工具收录的信息不全,标引深度不够(大多只对信息的中心主题进行标引,而不标引次要主题)、系统只能回答情报提问而不一定能满足情报需求等。 2.检索者本身的问题 一般的情况下检索者只能大概地表述自己的提问而且不能确切地衡量文献信息与提问的切题程度。加之,学科的不断发展,使课题的性质和范围也不断地变化。同时,检索方法还需不断的完善。

55 衡量检索效果的两个指标 查全率:查出相关文献量与文献库中相关文献总量的比率, 查全率(R)=查出相关文献量/库中相关文献总量*100%;
***查全率是指系统检索时能检出相关文献的能力。 查准率:查出的相关文献量与查出文献总量的比率, 查准率(P)=相关文献量/查出文献总量*100%。 ***查准率是指系统检索时拒绝不相关文献的能力。 两者结合起来,即表示检索效率。查全率和查准率之间存在互逆关系。

56 查全率、查准率 1.二者相背 查准率 2.目标优先 3.现有条件 查全率

57 查全率、查准率 1、影响查全率的种种因素如:检索词是否已扩 大到穷尽;是否合理应用逻辑“或”来优化检索; 是否对课题检索策略作了必要的扩大。
2、影响查准率的因素如:是否尽量选用了专指 度较高的检索词;是否尽量采用了逻辑“与”逻辑 “非”和位置算符进行优化检索;是否对所检课题 作了范围的有效限制等等。

58 影响查全率和查准率的主要因素 文献标引的广泛性和用户检索标识的专指性。
标引的广泛性是指标引时揭示文献主题基本概念的广度而言,是支配查全率的重要因素; 检索标识的专指性是指检索标识表达主题的基本概念的专指度而言,是支配查准率的重要因素。 对于一个信息检索系统来讲,系统内信息存储不全,收录遗漏严重;索引词汇缺乏控制;词表结构不够完善;标引缺乏详尽性,没有网罗应有的内容;信息分类(标引)专指度缺乏深度,不能精确地描述信息主题;组配规则不严密,容易产生模棱两可或歧义现象等,这些都是影响查全率和查准率的客观因素。  对检索者来说:检索课题要求不明确;检索工具选择不恰当;检索途径和方法过少;检索词缺乏专指性,检索面宽于检索要求;用词不当;组配错误等等。

59 优化检索策略 当检索结果显现太多,有和研究课题不相关的记录;显现太少和研究课题相关的记录或没有和课题相关记录时,必须重新思考并建立检索命题,对检索策略进行优化,进行缩检或扩检 。

60 确定查新、查准、和查全的指标要求: 若要了解某学科、理论、课题、工艺过程等最新进展和动态,则要检索最近的文献信息,强调“新”;
若要解决研究中某具体问题,找出技术方案,则要检索有针对性、能解决实际问题的文献信息,强调“准”; 若要撰写综述、述评或专著等,要了解课题、事件的前因后果、历史和发展,则要检索详尽、全面、系统的文献信息,强调“全”字。

61 去除意义重复的词 天然植物茶叶中提取茶多酚作为食品防腐剂 天然*植物*茶叶*提取*茶多酚*食品*防腐剂 茶叶*提取*茶多酚*食品*防腐剂
茶叶*茶多酚*食品*防腐剂 茶多酚*食品*防腐剂 茶多酚*(食品+防腐)

62 实例练习 孕期肾上腺髓质素及胎盘异铁蛋白水平变化与胎儿宫内发育迟缓的关系研究
(异铁蛋白 or 肾上腺髓质素) and (胎儿 and 发育)

63 少用或不用虚词 1、词义泛指度过大的词,如: “展望”——趋势、现状、近况、动态等 “应用”——作用、利用、用途、用法等
还有如“开发”、“研究”、“方法”、“影响”、“效率”等等。 2、词义延伸过多的词,如: “制造”——制备、生产、加工、工艺等 “提炼”——精炼、提取、萃取、回收、利用等

64 过长的词组与短语 课题“聚氨酯泡沫塑料的工艺” 选“聚氨酯泡沫塑料” 检索词,高度专指 “聚氨酯” and “泡沫塑料” “计算机辅助设计”

65 口头用语与书面用语的差别 对“海绵”的理解,世人已经共认为: “海绵”与 “泡沫塑料”、“泡沫橡胶”类物质等同。 例:海绵的制造工艺
检索式: 海绵and(制造or工艺) 实际是:海洋中的多孔类动物 对“海绵”的理解,世人已经共认为: “海绵”与 “泡沫塑料”、“泡沫橡胶”类物质等同。

66 少用无法定性定量的词 冷、温复合挤压连续成形技术 (冷挤压 or 温挤压) and 连续 and 成型
(冷or 温) and挤压and 连续 and 成型 冷= 常温以下 温=45`C ~ 600`C or 800`C 处理结果: 取消:冷、温二词 深化处理: 增加:挤压对象的词。如塑料、金属等词或其他如有助于限制范围的有效实词如:挤压时用的润滑材料:石墨。。。。

67 选定主要主题概念 课题“利用基因工程的手段提高植物中淀粉含量” 基因工程and淀粉 基因and淀粉

68 同义词实例 ? (企业or工厂)and(生产线or流水线)and(优化or计算机控制or在线控制or智能控制) 课题:“论企业生产线的优化”
检索式? 企业 and 生产线 and 优化 (企业or工厂)and(生产线or流水线)and(优化or计算机控制or在线控制or智能控制)

69 中西翻译的差异 “超分子”译成“super molecular”,而实际译成 “macro molecular”更为合适。

70 使用上位词 透明质酸、层粘连蛋白、Ⅲ型前胶原N端肽、Ⅳ型胶原、N-乙酰-β-D-氨基葡萄糖苷酶、血浆内皮素-1联合检测在早期肝硬化中的应用价值研究 早期肝硬化 and 检测 and 指标

71 常用的数据资源有哪些? 电子图书: 超星数字图书馆;方正、书生之家 中文期刊: 中国知网;维普资讯数据库;万方,CBM
外文数据库:Pubmed 搜索引擎:GOOGLE, baidu 论坛:小木虫、丁香园

72

73

74

75

76

77

78 结束 The end 谢谢!


Download ppt "医学文献检索讲座 广东医学院 文献检索教研室 钟伟金 2012.4."

Similar presentations


Ads by Google