第九章 信息处理与分析 第一节 文献检索策略 与案例分析

Slides:



Advertisements
Similar presentations
2014 年浙江省数量资料 华图网校 刘有珍 数字推理 年份题量数字规律 三级等差 2. 和递推 3. 幂次修正 4. 倍数递推 5. 倍数递推 6. 特殊差级 7. 倍数递推 8. 倍数递推 9. 积递推 10. 分数数列
Advertisements

鼻咽癌 一 ﹑ 病因 ( 一 ) 病毒 本病与 EB 病毒感染有关。 ( 二 ) 遗传因素 鼻咽癌患者有家族聚集性和种族易感性, 与遗传因素有关。 ( 三 ) 化学致癌物 一些化学物质(如多环芳烃类、亚硝胺 类、微量元素镍等)与鼻咽癌的发生有一 定的关系。
首页 全国高等学校招生考试统一考试 监考员培训 广州市招生考试委员会办公室.
延边大学 2016年度本科专业评估指标体系解读.
九十五年國文科命題知能 研習分享.
司 法 考 试 题 2002年——2009年.
人口增长.
深入Pubmed,了解不一样的生物医学世界
2013届高考复习方案(第一轮) 专题课件.
普通高等学校 本科教学工作水平评估方案.
专题二 文学类文本·小说阅读(选考) ——把握人事,洞察百态 补上一课 如何读懂小说 第1讲 情节 第2讲 人物 第3讲 环境 
第二节 金融资产的计量 一、金融资产的初始计量 二、公允价值的确定 三、金融资产的后续计量 四、以公允价值计量且其变动计入当期损益的金融
第一部分 微专题强化练.
第十六专题 近代以来世界的科学 技术和文学艺术
第二章 复式记账原理*** 主要内容、重点难点: 1.会计要素与会计等式*** 2.会计科目与账户*** 3. 借贷记账法***
第一章 会计法律制度 补充要点.
欧洲西部 要点·疑点·考点 欧洲西部 1. 自然环境 位置:欧洲西半部,北临北冰洋,西临大西洋,南临地中海
二、个性教育.
服务热线: 菏泽教师招聘考试统考Q群: 菏泽教师统考教育基础模拟题解析.
第二单元 生产、劳动与经营.
《中医基础理论》 考试题型特点和答题指导.
肾衰竭.
经典中文期刊全文数据库检索 与通用技巧 王建涛 QQ:
1、分别用双手在本上写下自己的名字 2、双手交叉
2011年广西高考政治质量分析 广西师范大学附属外国语学校 蒋 楠.
第一单元 生活与消费 目 录 课时1 神奇的货币  课时2 多变的价格 课时3 多彩的消费.
用问题激发学生的思维 \.
碘缺乏病.
第23课时 现代中国的科学技术与 文化教育事业.
知识回顾 1、通过仔细观察酒精灯的火焰,你可以发现火焰可以分为 、 、 。 外焰 内焰 焰心 外焰 2、温度最高的是 。
2016届高三期初调研 分析 徐国民
2007年11月考试相关工作安排 各考试点、培训中心和广大应考人员:
知识点一 第一节 理解教材新知 知识点二 区域的基本含义 知识点三 考向一 把握热点考向 考向二 随堂基础巩固 应用创新演练 课时跟踪训练
分式的乘除(1) 周良中学 贾文荣.
时政研修室 抓住3个基础知识点 高效训练5个题 掌握2个核心考点 课时限时检测.
第四章 制造业企业 主要经济业务核算.
《思想品德》七年级下册 教材、教法与评价的交流 金 利 2006年1月10日.
财经法规与会计职业道德 (3) 四川财经职业学院.
2 分子的热运动.
第一课 神奇的货币 第二框 信用工具和外汇 1-2 信用工具和外汇.
第一篇:静力学 1 、研究的主要问题:力,力系的简化原理 及物体在力系作用下的平衡问题。 2 、研究方法:对物体(或物体系)进行受
面向海洋的开放地区——珠江三角洲 山东省高青县实验中学:郑宝田.
第一章 民法概述 一、民法概念 P4 二、民法的调整对象 三、民法的分类 四、民法的渊源 P10 五、民法的适用范围(效力范围)
第七章 财务报告 财务报告 第一节 财务报告概述 一、财务报告及其目标: 1、概念:财务报告是指企业对外提供的反映企业某一特定日期
发展心理学 王 荣 山.
第四课时 常见天气系统 阜宁一中 姚亚林.
成才之路 · 地理 人教版 · 必修3 路漫漫其修远兮 吾将上下而求索.
平行线的性质 (第一课时) 说课者:邓燕锋 大亚湾区第二中学.
欢迎来到我们的课堂!.
第 十一 课  寻觅社会的真谛.
文化生活第三单元 中华文化和民族精神.
第二章 负债 1、负债的概念:是指过去的交易或事项形成的、预 期会导致经济利益流出企业的现时义务。 2、负债的分类 流动负债 短期借款
第四章第一节 增值税法律制度2 主讲老师:梁天 经济法基础.
第七章 财务报告 主讲老师:王琼 上周知识回顾.
通識教育中心 邱子恒 資訊檢索之理論與實作 通識教育中心 邱子恒
實證醫學常用資源及檢索 策略介紹 林愉珊 典藏閱覽組 國立陽明大學圖書館 民國98年5月11日.
資訊檢索之策略與技巧 The Strategy & Techniques of IR
《2015考试说明》新增考点:“江苏省地级市名称”简析
第一节 相关概述 第二节 积差相关系数 第三节 其他相关系数
变 阻 器 常州市北郊初级中学 陆 俊.
第五章 相交线与平行线 三线八角.
K1 雨巷——戴望舒.
基础会计.
5.2.2平行线的判定.
第五课 提升职业道德境界 在职业实践中锤炼.
坚持,努力,机会留给有准备的人 第一章 四大金融资产总结 主讲老师:陈嫣.
中级会计实务 ——第一章 总论 主讲:孙文静
序偶及直角坐標系統.
数学建模示例 椅子能在不平的地面上放稳吗 问题分析 模型假设 通常 ~ 三只脚着地 放稳 ~ 四只脚着地
平面的基本性质 江苏省泰州中学 数学组 姜莹. 平面的基本性质 江苏省泰州中学 数学组 姜莹.
Presentation transcript:

第九章 信息处理与分析 第一节 文献检索策略 与案例分析 第九章 信息处理与分析 第一节 文献检索策略 与案例分析

一、文献检索策略概述 二、文献检索效果评价 三、文献检索策略构建案例分析

一、文献检索策略概述 (一)检索策略的定义 (二)常用的检索策略类型

(一)检索策略的定义 广义的检索策略 指为实现检索目标而制定的全盘计划和方案,是对整个检索过程的科学规划和指导。 具体而言就是在明确检索目的、分析课题特征的基础上,选择合适的数据库和检索系统,拟定检索方案,确定检索词,构建检索提问式,执行检索并调整检索式,直至获得较满意的检索结果的全过程。

检索策略的制定流程 不满意 满意 用户 检索课题 检索目的分析 课题内容特征分析 课题形式特征分析 选择数据库 及检索系统 跨库检索系统 1.侧重检全 2.侧重检准 3.检全检准平衡 课题内容特征分析 1.所属学科 2.主要概念面 3.各概念面的分支概念 课题形式特征分析 1.检索年限 2.文献类型 3.文献语种等 选择数据库 及检索系统 跨库检索系统 核心检索系统 全文数据库 侧重查全 适用各种情况 侧重查准 拟定检索词 编制检索式 浏览并优化检索结果 获取全文 输出检索结果 不满意

(一)检索策略的定义 狭义的检索策略 特指检索过程中构建检索式的环节 包含检索词的确定,运算符的选择,检索字段的设定及限制选项的设置等

(二)常用的检索策略类型 积木型(Building Block) 把检索课题剖析成若干个不同的概念面,逐个查找各个概念面 在每个概念面检索时尽可能全地列举同义词、近义词和相关词,用“OR”连接,构成针对每个概念面的检索式,即多个子检索式 最后根据课题要求,选用合适的布尔算符把所有子检索式连接起来,构成一个总的检索式 这种策略类似把各个积木块拼成完整图案,因此称为积木型检索策略

(二)常用的检索策略类型 引文珠形增长(Citation Pearl-Growing) 首先检索课题中较为核心的、最专指的概念面,以便至少检出一篇命中文献或相关信息 浏览检出文献,从中选出新的相关检索词,补充到检索式中,重新检索出更多的命中文献 然后再重复进行浏览选词再检索的过程,直到获得理想的最终检索结果为止 这种策略最具交互性,检索词更具针对性,检索式在变化中完善,不足是检索费时较多

(二)常用的检索策略类型 逐次分馏(Successive Fractions) 先用较宽泛的检索式,确定一个范围较广的命中文献初始集 然后逐步利用各种检索限制或限定措施,逐渐提高校索式的专指度,缩小命中文献集,直到得到数量适宜、用户满意的命中文献集为止 这种策略有利于平衡检索的全面性和准确性,如能较好地掌握检索限制和限定的尺度,可取得相当好的检索效果

(二)常用的检索策略类型 最专指面优先(Most Specific Facet First) 首先从课题中最专指的一个概念面入手检索,得到初步检索结果后再决定是否要加入其他概念面 这些其他概念面只有在要提高查准率时才需输入,各概念面在检索式中是逻辑 “与”的关系 如果觉得命中文献太少,通常不需要再把其他概念面加到检索式中去 这种策略比较灵活,检索用时也相对较少

(二)常用的检索策略类型 最低登录量面优先(Lowest Posting Facet First) 登录量是指一个索引词在标引中的使用次数 用户在索引词表界面查询课题中每个概念面对应的检索词的登录量,用登录量最少的概念面为入口开始检索 如命中文献相当少,则完成检索。如结果较多,再选择登录量较低的概念加入到检索式中,逻辑关系为“与” 这种策略与最专指面优先策略极为相似,不同的是在计算机检索中,很容易明确哪个概念组面的登录最小

二、文献检索效果评价 (一)查全率 (二)查准率 (三)查全率与查准率的关系 (四)影响查全率和查准率的因素

数据库检索结果距阵 用户 数据库 相关文献 非相关文献 总计 检出文献数 a(命中) b(噪音) a+b 未检出文献数 c(漏检) d(合理拒绝) c+d 合计 a+c b+d a+b+c+d

(一)查全率 查全率(Recall Ratio,简称R) 是检索系统中检出的相关文献数量(a)与检索系统中相关文献总量(a+c)的比率,即:

(二)查准率 查准率(Precision Ratio,简称P) 是检索系统检出的相关文献数量(a)与检出的文献总量(a+b)的比率,即:

(三)查全率与查准率的关系 查全率与查准率之间为互逆的关系 通常采取措施提高查全率时会降低查准率 反之,采取措施提高查准率时则会降低查全率 在检索中很难实现查准率和查全率均逼近100% 在检索中要根据课题的实际需求,确定以查准为主还是以查全为主,或是寻求查准与查全之间的平衡。

(四)影响查全率和查准率的因素 提高检全度的方法 将检索词限定到文摘、全部字段等 使用截词符。如:transplant* 使用同义词。如:(lung cancer or lung carcinoma) 查全同义单词的不同拼写方式 如:fibre or fiber 查全缩写与全称 如:“ang 1 7” OR “angiotensin 1 7” 变词组检索为邻近检索 如:“acute pancreatitis” 改为 acute adj2 pancreatitis

(四)影响查全率和查准率的因素 提高检准度的方法 将检索词限定到标题、关键词字段 设定在数据库的某个或若干个子集中检索 例:core clinical journals子集(Medline) Clinical Medicine大类(Elsevier) 变and检索为邻近算符:near, adj… 例:acute and pancreatitis 改为: acute adj2 pancreatitis (OVID) 使用词组精确匹配运算符“ ” 例:“renal failure”

(四)影响查全率和查准率的因素 寻求查准和查全平衡的方法 使用规范主题词表选词检索 没有对应规范主题词的概念 首先使用上级概念对应的规范词检索 再结合自由词检索 例:肾盂肿瘤放射学诊断 主题词:kidney neoplasms 副主题词:放射学诊断对应的副主题词 结合自由词:kidney pelvis 没有词表的数据库:调整检索字段和运算符

三、文献检索策略构建案例分析 【案例1】有读者要撰写“国内外舌根肿瘤手术治疗新进展”的综述,需查阅相关文献。 【案例2】有读者要申报关于“血管紧张素1-7对心肌作用”的科研项目,需了解国外是否有相关研究,对课题的新颖度作出评价。 【案例3】有读者在配制中成药过程中,要使用龙涎香,他想了解国内外有关“龙涎香在配制中成药中应用研究”的文献。 【案例4】有读者在撰写“双酚A对生殖系统毒性研究”的论文,要查找国内外相关论文作为参考。

【案例1】有读者要撰写“国内外舌根肿瘤手 术治疗新进展”的综述,需查阅相关文献。 检索目的: 撰写综述,作文献普查,侧重查全。 课题内容特征: 所属学科:口腔疾病中的舌肿瘤。 包含概念面:“舌根肿瘤”、“手术治疗”, 均无分支概念。

【案例1】有读者要撰写“国内外舌根肿瘤手 术治疗新进展”的综述,需查阅相关文献。 课题形式特征 检索年限最近五年。 文献类型:期刊、会议文献。 文献语种:中外文各种语种。 选择数据库及检索系统 CBM 万方中国学术会议论文全文数据库 OVID-MEDLINE ISI-ISTP

【案例1】有读者要撰写“国内外舌根肿瘤手 术治疗新进展”的综述,需查阅相关文献。 拟定检索词和检索式 CBM:舌肿瘤/外科学 and 舌根 万方会议论文:积木型策略 全部字段=(舌根肿瘤 或 舌根部肿瘤 或 舌根癌)and 全部字段=(手术 或 外科 ) OVID-MEDLINE: tongue neoplasms/surgery and tongue adj3 base ISI-ISTP:积木型策略 Topic=((tongue same base same cancer) or (tongue same base same carcinoma)) and (surgery or operation*)

【案例2】申报“血管紧张素1-7对心肌作用”的科研项目,了解国外研究情况,判断新颖性。 检索目的:新颖性评价,侧重查全 课题内容特征: 所属学科:神经肽类物质对人体脏器的作用 包含概念面:“血管紧张素1-7”、“心血管系统” 分支概念:“心肌”有分支概念“心肌细胞”、“乳头肌”、“心成肌细胞”

【案例2】申报“血管紧张素1-7对心肌作用”的科研项目,了解国外研究情况,判断新颖性。 课题形式特征 检索年限:全部年份 文献类型:期刊、会议文献 文献语种:外文各种语种 选择数据库及检索系统 OVID-MEDLINE ISI-ISTP

【案例2】申报“血管紧张素1-7对心肌作用”的科研项目,了解国外研究情况,判断新颖性。 拟定检索词和检索式 OVID-MEDLINE:引文珠增长型 1950-present: exp myocardium/ and (“angiotensin-(1-7)” or “angiotensin1-7” or “ang-(1-7) ” or “ang1-7” ) In-Process & Other Non-Indexed Citations: 最专指面优先 “angiotensin-(1-7)” or “angiotensin1-7” or “ang-(1-7) ” or “ang1-7”

【案例2】申报“血管紧张素1-7对心肌作用”的科研项目,了解国外研究情况,判断新颖性 拟定检索词和检索式 ISI-ISTP:积木型 Topic = (("angiotensin-(1-7)" or "angiotensin1-7" or "ang-(1-7) " or "ang1-7") and (myocardi* or cardiac myocyte* or cardiomyocyte* or papillary muscle* or cardiac myoblast* or cardiomyoblast*))

【案例3】在配制中成药过程中,要使用龙涎香,需了解国内外有关“龙涎香在配制中成药中应用研究”的文献。 检索目的:解决实际问题,侧重查准 课题内容特征 所属学科: 中草药研究 包含概念面: “龙涎香”、“中成药” 分支概念: “龙涎香”没有分支概念 ,“中成药”分支概念众多

【案例3】在配制中成药过程中,要使用龙涎香,需了解国内外有关“龙涎香在配制中成药中应用研究”的文献。 课题形式特征 检索年限:全部年份 文献类型:期刊文献 文献语种:中外文各种语种 选择数据库及检索系统 EMBASE CBM

【案例3】在配制中成药过程中,要使用龙涎香,需了解国内外有关“龙涎香在配制中成药中应用研究”的文献。 拟定检索词和检索式 EMBASE: (ambergris and synthesis).ti CBM:最低登录量优先 索引检索:龙涎香

【案例4】撰写“双酚A对生殖系统毒性研究”的论文,要查找国内外相关论文作为参考。 检索目的:查准与查全的平衡,注重获取全文 课题内容特征 所属学科:酚类对人体脏器毒性 包含概念面: “双酚A”、“生殖系统”、“毒性” 分支概念: “生殖系统”分支概念众多 “双酚A”别名:“二酚基丙烷”、“2,2-双对羟苯基丙烷”、 “2,2-Bis-4-hydroxyphenylpropane”、 “BPA”、“4,4'-Dihydroxy-2,2-diphenylpropane”、“4,4'-Isopropylidenediphenol”

【案例4】撰写“双酚A对生殖系统毒性研究”的论文,要查找国内外相关论文作为参考。 课题形式特征 检索年限:最近5年 文献类型:期刊文献 文献语种:中外文各种语种 选择数据库及检索系统 OVID-MEDLINE 中国期刊全文数据库

匹配主题词

phenols 酚类,上位词 没有对应的主题词,作为自由词检索

检出11篇文献

浏览详细记录的文摘、物质名称、 主题词等字段,判断检索用词是否正确

输入检索词bisphenol a 选择物质名称字段

进行下位词扩检 上位概念“酚类”的规范主题词形式

选择副主题词“毒性(toxicity)”

“生殖系统”的规范主题词形式

合并检索式

【案例5】二酚基丙烷(双酚A)对生殖系统的毒性研究。 最终检索结果112篇,需进一步缩小检出文献篇数。

主要主题词限制, 获取重点论述该主题的文献 出版时间限制,获取较新的研究成果

中国期刊全文数据库