经典中文期刊全文数据库检索 与通用技巧 王建涛 QQ:47072005 数据库检索: 经典中文期刊全文数据库检索 与通用技巧 王建涛 QQ:47072005 Email:nbwangjt@gmail.com
本次课主要内容 数据库检索通用技术与方法 信息检索七准则 检索词选择与课题分析 中国期刊全文数据库(CNKI)检索 中文科技期刊数据库(维普)检索 万方数据库期刊检索
1. 数据库检索通用技术与方法 数量众多的数据库: http://lib.nit.net.cn/ 恒变 不变 信息环境-----日新月异 数据库的检索界面、检索功能、版本形式经常会有变化 不变 基本技术与基本原理 方法或技巧 我们可以突破一个,其它触类旁通!
1.1 数据库检索的一般步骤 分析检索课题,明确信息需求 选择检索工具,了解检索系统 确定检索途经,选定检索方法 实施检索策略,浏览初步结果 调整检索策略,获取所需信息 得到一组主题词(关键词)和一些限定要求(如年限、学科领域等) 数据库的基本情况和检索功能、检索途径 浏览模式 分类|主题| |文献类型 匹配模式 精确|模糊 |截词检索 逻辑检索 逻辑算符 逻辑组配 检索途径 [检索项] 题名|主题 检索模式 初级检索| 高级|专家 结果处理 排序|选择| 获取|使用 特色功能 与 拓展服务
1.2 如何获得数据库的检索帮助与指南信息 一般数据库界面上都有“帮助”或者“检索指南”。 图书馆等文献机构发布数据库时提供的使用帮助。 通过Google等搜索引擎搜索。 如:filetype:ppt 读秀
1.3 如何应用文献信息的老化规律 随着时间的推移,信息的价值会逐渐衰减乃至失效。文献信息表现出老化规律。文献信息老化的情形有: 所含信息仍有用,但现在已经被包含在其它更新的文献中。 所含信息仍旧有用,但现在正处于人们对其兴趣下降的学科。 所含信息仍旧有用,但为后来的文献所超越。 所含信息不再有用。 文献的半衰期:某学科领域现时还在利用的全部文献中的一半是在多长的时间内发表的。例如:物理学文献的半率期是4.6年,即是说:现时仍在利用的物理学文献的50%,其出版年龄不超过4.6年。 半衰期与文献的增长、学科差异、学科发展的阶段和信息环境与需求有关。
老化规律应用 在进行文献信息检索时,注意文献出版年的限定。学术信息的半衰期一般是3~5年。许多信息的老化如艺术品、经济信息、市场信息等表现出跳跃性。有时突然失效,有时永不失效。 查阅文献信息时尽量选取较新的文献。同时要顾及较早的文献。一般性研究可选择近5年来的文献即可。了解背景资料的则要长得多。 对发达国家的文献的利用可以在中文文献年限的基础上增加3~10年。
1.4 信息检索效果评价 检索效果(retrieval effectiveness)是指检索系统检索的有效程度,它反映检索系统的能力。 也涉及实施检索的人所能发挥检索系统的最大能力、效益等因素。 包括6个方面:收录范围、查全率、查准率、响应时间、用户负担及输出形式。其中两个主要的衡量指标是查全率(Recall ratio)和查准率(precision ratio),分别用 R 和 P 大写字母表示。
相关文献 非相关文献 总计 检出文献 a(hit) b(noise) a+b 相关文献 非相关文献 总计 检出文献 a(hit) b(noise) a+b 未检出文献 c(mission) d(rejected) c+d 总计 a+c b+d a+b+d+c 查全率(Recall Ratio): R= a/(a+c) * 100 % 查准率(Precision Ratio): P= a/(a+b) * 100 % 一系列的实验结果表明查全率与查准率之间存在互逆关系 。
1.5 数据库检索常见问题 对信息检索有畏惧心理 不理解信息检索过程或原理,无法做到触类旁通。 不知道选择什么样的数据库检索,到哪里检索 1.5 数据库检索常见问题 对信息检索有畏惧心理 不理解信息检索过程或原理,无法做到触类旁通。 不知道选择什么样的数据库检索,到哪里检索 不知道如何选择恰当的检索词 在文摘索引数据库中想下载全文 仅仅用一个词检索(不会利用逻辑组配) 在外文数据库中输入中文词检索
数据库检索常见问题(续) 说说看,各位还有哪些问题? 信息环境意识不强,在网络中搜索一个数据库就进行检索 用整个论文(或课程)题名在题名项中检索 检索结果太多(不会用限定和组配) 检索结果太少(课题分析不够;检索词选取) 检索结果的处理(排序、下载、阅读器、复制) 说说看,各位还有哪些问题?
2.信息检索七准则 你得到什么检索结果,取决于你怎么提问(即主题概念分析) 去信息应该在的地方检索 (即选择数据库) 向你的检索结果提问 ―― 信息可能是真的,但内容仍然会有错的(检索结果的判断,内容的选取) 检索是一个多步骤的过程(扩检、缩检) 检索结果必须符合需求(检索结果的选择) 咨询图书馆员(获得帮助) 信息本身是无意义的,只有人提问之后才有价值(撰写论文吧,让信息增值) 信息检索准则编译自:http://www.infotoday.com/searcher/jan02/block.htm
3. 检索词选择与课题分析 检索课题的分析,即主题分析,以明确课题所包含的概念成份及其相互关系。这是检索策略制定的根本出发点,也是检索效率高低或成败的关键。检索课题的分析要明确以下问题: 分析课题的主要内容其所涉及的学科范围。 确定关键词(同义词、近义词、上词)。 所需文献的类型、语种、年代及文献量的范围。 对查新、查准、查全的指标要求,及其侧重。
若要了解科技的最新动态、学科的进展、了解前沿、探索未知,则强调一个“新”字; 若要解决研究中的具体问题,则要强调一个“准”字; 若要了解一个全过程,撰写综述、作鉴定、报成果,就要回溯大量文献,要求检索的全面、详尽、系统,则要强调一个“全”字。
3.1 主题(概念)分析的一般技巧 明确检索课题(信息需求)。进行简单的主题概念分析后,得到几个关键词。 从自己的信息环境中选择任何形式的信息源(课本、笔记、图书馆、数据库、参考工具书、网络、人),去查阅资料,了解检索课题相关的一些知识与信息,找到准确、全面的主题概念(同义词、近义词、上位词、下位词、相关词等),分析检索词间的逻辑关系,选择合适的数据库。
边检索边学习。不但地明确自己的信息需求,对检索结果进行评价,适时调整检索策略。 信息检索是在掌握全面知识(如:信息环境、检索知识、检索策略等的要求高)的基础上的灵活运用
3.2 什么是概念组配 概念组配是叙词语言的基本原理。 概念组配与字面组配在形式上有时相同,有时不同;而从性质上来看两者区别是很大的。字面组配是词的分析与组合(拆词);概念组配是概念的分析与综合(拆义)。例如: 字面组配 模拟+控制-->模拟控制 香蕉+苹果-->香蕉苹果 概念组配 模拟+控制-->模拟控制 香蕉味食品+苹果-->香蕉苹果 《汉语主题词表 》10个分册
3.3 分析检索的内容实质 从镀锌残渣中回收锌 工艺? 实际是:从高品位镀锌残渣中分离铁 所以检索需求可以这样表述: “从锌块中分离铁”
3.4 隐性主题的处理---主题概念具体化 请分析主题概念。 课题:高温下使用的不锈钢 “不锈钢” “耐热钢”
隐性主题具体化 如:酸洗费液的处理 处理:“回收”、“再生” 如:煤灰利用 具体利用:? 检索式: (粉煤灰+煤炭)*(利用+砖+水泥+混凝土+路基+……)
3.5 找出核心概念,简化逻辑关系 并不是概念越多越好! 抓住主题的核心:最能表达检索课题内容,而且具有实际检索意义的关键词。 如“利用稻米皮糠提取天然食品色素” 稻米、皮糠、提取、天然、食品色素 稻米、食品色素
排除检索意义不大的词 排除检索意义不大而且比较泛指的概念 不要望词生义 如:展望、发展趋势、现状、近况、生产工艺、应用、利用、作用、方法、影响、制备、结果 不要望词生义
3.6 明确概念间的逻辑关系 同义词、近义词是或的关系 用上位词 即扩检,如“教育心理学” 用下位词 即缩检,如“智育心理”、“德育心理”、“美育心理”、“教学心理学”、“学习心理学”、“教师心理学”、“学生心理学”等。 若多个下位词都用来检索,相对于一个上位词来说,一般是扩检。 一个下位词相对于一个上位词来说,一般是缩检。
3.7 一般可以选择的词 表示具体事物名称的名词术语,如汽车、变压器、反应堆、水稻、坐标仪等; 3.7 一般可以选择的词 表示具体事物名称的名词术语,如汽车、变压器、反应堆、水稻、坐标仪等; 表示事物的状态或现象的名词术语,如强度、失真、土壤熟化、日冕、船舶过载等; 表示科学分类的名词术语,如数学、物理学、中医学、电子学、建筑工程、水利工程等; 表示研究方法、技术方法的名词术语,如分析(化学)、针刺手法、有限元法、结构功能法、力学性能试验等; 本页面内容参考《汉语主题词表》
表示工艺方法、加工技术的名词术语,如铸造、锻造、热处理、焊接、酿造、取心钻进、爆破成型、激光切割等; 表示化学元素、化合物、金属材料与合金的名词术语,如钠、氧原子、ⅣA族元素、钠化合物、硅化物、硫酸、钛络合物、钉胺、呋喃、吡啶、醇聚四氟乙烯、丁二酸(P)以及如金属板耐蚀钢、耐蚀合金等; 表示国家名称、地名、组织机构名称及人名的专有名词以及文献类型、文献载体的名词术语,
3.8 课题分析实例 1.检索课题:网络资源的知识产权保护 关 键 词:网络资源/网络信息资源/知识产权保护/版权/著作权限/合理使用 1.检索课题:网络资源的知识产权保护 关 键 词:网络资源/网络信息资源/知识产权保护/版权/著作权限/合理使用 2.检索课题:经济领域犯罪的心理分析 关 键 词:经济犯罪/犯罪心理分析 3.检索课题:关于经济领域诈骗行为心理剖析 关 键 词:经济诈骗/诈骗心理 /经济犯罪/犯罪心理分析
4.检索课题:家庭、婚姻裂变和青少年犯罪的内在联系 关 键 词:离婚/单亲/家庭/青少年犯罪/未成年人犯罪 5.检索课题:国内外社会保障制度比较研究 关 键 词:社会保障/社会救济/社会保险/失业保险/养老保险/医疗保险 6.检索课题:食品添加剂 关 键 词:壳聚糖/溴酸钾/柠檬酸
4 中国期刊全文数据库(CNKI)检索 简介 入口(从哪里进入数据库) 检索界面介绍 检索实例
4.1 简介 CNKI即中国基础设施工程(National Knowledge Infrastructure,CNKI),也称为中国知网。为了针对不同的用户团体进行销售,数据库既有细分专门的数据库,也有整合的数据库检索形式,其产品形式和名称与经常变动(其核心产品变化不大)。比如中国学术文献网络出版总库系列数据库有: 中国期刊全文数据库(中国学术期刊网络出版总库) 中国博士学位论文全文数据库 中国优秀硕士学位论文全文数据库 中国重要报纸全文数据库 中国重要会议论文全文数据库 中国专利数据库 中国标准数据库 中国成果数据库 中国年鉴网络出版总库 ……
中国期刊全文数据库 (=中国学术期刊网络出版总库) 简 介:该库是目前世界上最大的连续动态更新的中国期刊全文数据库,收录国内7000多种重要期刊,以学术、技术、政策指导、高等科普及教育类为主,同时收录部分基础教育、大众科普、大众文化和文艺作品类刊物,内容覆盖自然科学、工程技术、农业、哲学、医学、人文社会科学等各个领域,全文文献总量2000多万篇。 文献来源:中国国内8200多种综合期刊与专业特色期刊的全文。 产品形式:WEB版(网上包库)、镜像站版、光盘版、流量计费。 收录年限:1994年至今(部分刊物回溯至创刊) 更新频率 网上包库:每日更新5000~7000篇, 各镜像站:一般不会每日更新 专辑光盘:每月更新,专题光盘:年度更新。
4.2 《中国期刊全文数据库》入口 本馆 浙大图书馆 园区图书馆(宁波数字图书馆) 科技信息研究院(NBSTI) 中文TOP10 数字资源中选择、浏览、检索 查找资料:期刊论文 浙大图书馆 园区图书馆(宁波数字图书馆) 科技信息研究院(NBSTI)
进入检索界面—熟悉检索界面(网络版)
年限限定很有必要 另一个词,可为空 检索途径 逻辑关系 检索词记录 相关词 增加检索途径和逻辑组配 精确检索 网络版无效
注意:跨库检索和单库检索的区别
检索—以镜像站为例子 检索方式:提供了快速检索、标准检索、专业检索等多种检索方式,并可在检索结果中进行二次检索。同时还设有期刊导航、学科内容分类导航等多项个性化检索方式。用户还可不需要输入具体的检索词即可按分类和期刊名称字顺等方式查找所需期刊,并可链接浏览全文。 检索途径:关键词、题名、刊名、作者、第一作者、文摘、来源、基金、全文、参考文献、主题。 检索系统:支持布尔逻辑检索和限定检索,提供了学科范围和年代的限定。 全文下载:支持CAJ和PDF文件。
镜像站版界面 检索词记录 相关词 增加检索途径和逻辑组配
检索策略一:一个词检索 选择篇名检索途径 采用默认的无限定检索 学科领域范围限定 相似词与此间关系辅助选词
检索结果分析与调整检索策略:一 问题 检索结果太多:22384条! 这么多的信息量是无法都看完的,也不知道哪些信息适合自己。 检索结果出现误差:比如出现了“管理信息”,而且“信息”和“管理”竟然分开了,这些都不是检索需求的初衷。
调整检索策略—缩小检索 限定检索年限:根据文献老化规律,一般选择5~10年内的文献比较合适。 让数据库帮助自己选择高质量的文献:选择核心期刊 按照原意检索:选择精确检索模式。(在网络版中,精确检索无效)
检索策略二:一个词检索+限定检索+精确检索
检索结果分析与调整检索策略:二 问题 再次调整检索策略—缩小检索 尽管检索结果数量大幅减少(513条),但要阅读这样多的文献也是比较麻烦的事情。 经过阅读检索结果标题,发现我是想检索有关“医药信息管理”方面的文献,好多不是与医药相关的。 再次调整检索策略—缩小检索 增加一个检索词“医药”,逻辑组配选择“并且”。
检索策略二:二个词检索+限定检索+精确检索
检索结果分析与调整检索策略:三 问题 再次调整检索策略—扩展检索 检索结果为0!,缩减的太厉害了,看来要扩展检索了! 增加检索学科领域:医药卫生 文献质量档次降低:全部期刊(不仅仅是只要核心期刊的论文了)
OK!,可以看论文全文了! 点击篇名进入论文详细信息与下载页面
论文详细信息和全文下载页面 点击下载全文 题录摘要信息 知网节
检索项/检索途径对应内容
5 中文科技期刊(维普)数据库检索 简介 入口(从哪里进入数据库) 检索界面介绍 检索实例
5.1中文科技期刊(维普)数据库简介 最大的全文期刊数据库之一。收录1989-1999年出版期刊7000种,2000年后出版期刊12000余种。 ,全文 2300 余万篇,引文 3000 余万条,分三个版本(全文版、文摘版、引文版)和8个专辑(社会科学、自然科学、工程技术、农业科学、医药卫生、经济管理、教育科学、图书情报) 2005年,维普和全GOOGLE(谷歌)进行战略合作,成为“Google学术搜索”网站最大的中文内容提供商。 收录年限:1989年至今 特点:收录期刊更全。 因为最初因“中文科技期刊”而得名,其实和CNKI一样是综合性的数据库,涵盖所有的学科领域。
5.2中文科技期刊(维普)数据库入口 本馆 浙大图书馆 宁波数字图书馆/谷歌学术搜索 科技信息研究院(NBSTI) 中文TOP10 数字资源中选择、浏览、检索 查找资料:期刊论文 浙大图书馆 宁波数字图书馆/谷歌学术搜索 科技信息研究院(NBSTI)
检索界面---一般检索 一般检索默认为模糊检索 高级检索入口 一般检索
检索界面—高级检索 菜单式检索 专业检索
检索结果处理 题录摘要下载(含参考文献格式) 点击论文题名进入全文下载页面
点击下载全文
宁波数字图书馆期刊检索 中文科技期刊(维普)数据库全面整合到宁波数字图书馆中,选择期刊检索,即可下载全文(宁波市范围内)。
谷歌学术搜索—http://scholar.google.cn/
谷歌学术搜索—检索结果界面 点击论文题名进入全文下载页面 有重庆维普网站标识
大量相关课件下载 请通过搜索引擎获取数据库的检索课件
6 万方数据库期刊检索 期刊6300多种 检索结果界面简洁
万方数据库期刊检索入口 本馆 浙大图书馆 宁波数字图书馆 科技信息研究院(NBSTI) 中文TOP10 数字资源中选择、浏览、检索 查找资料:期刊论文 浙大图书馆 宁波数字图书馆 科技信息研究院(NBSTI)
万方数据期刊检索界面
高级检索界面
经典高级检索界面
详细检索帮助文档 http://www.shwanfangdata.com/WFknowledgeServer_Mirror/Help/paper.html