计算机检索的原理与 步骤 主讲人:董宁.

Slides:



Advertisements
Similar presentations
一级建造师考试心得交流. 摘 要 建造师制度简介 一级建造师报考要求 一级建造师考试制度 一级建造师考试内容 一级建造师与二级建造师区别 考试及培训心得交流.
Advertisements

通知 作业:以你熟悉的(本地)非物质文 化遗产为例,说明其保护与管理现状 考试: 11 月 12 日晚 7 点,地点 、
文学灵感论 蓦然回首,那人却在灯火阑珊处 ……. 生活中、科学中的灵感 运动鞋 电梯 阿基米德与皇冠 牛顿的三大定律.
历史组:李丹 这首歌歌颂了党的十一届三中全会的哪项重大决策 ? 自主学习 : 带着问题阅读教材 : 1 、什么是对外开放 ? 2 、我国为什么要实行对外开放 ? 3 、对外开放的格局是怎样形成的 ?
对外开放格局的形成. 刚刚听到的歌曲的名字? 1979 年的春天指什么? “ 画一个圈 ” 是指什么?
国内外新药研究开发的现状 刘墨祥. 国内新药研究开发的现状  21 世纪的第一年我国加入了 WTO ,标志着从此 我国接受了按照国际规则参与全球竞争,这一规 则在医药行业也不例外,因而我们面临着真正的 国际竞争压力、面临着如何解决好本世纪我国的 医疗保健措施、药学事业、医药经济发展等一系 列重大问题。因而加强、加快自主创新药物研究.
秦代舞蹈 本檔案圖片來源: google 圖片. 戰國七雄終結者 統一文字制定律法 郡縣名田  秦王征服六國,終結分裂割 據的局面,建立中國歷史上 第一個中央集權的封建大帝 國,統一文字、制定律法與 郡縣、名田等制度,將戰國 時期散漫衰敗狀態的社會, 轉變成統一強大的國家。 秦始皇.
公營事業民營化前後績效之比較 -- 以陽明海運公司為例 交通部運輸研究所 中華民國 94 年 2 月.
台灣農民的地位與形象 —— 以「無米樂」 (2005 年 ) 為例. 故事大綱  紀錄臺南縣後壁鄉三個老稻農的勞動與生活  透過他們的勞動與生活,我們可以領略到生 活的智慧,也可以意會到人與人、人與動物、 人與神、人與天、人與土地,是如何微妙地 共生共存著  可是我們曾經想過 , 這群老農民就像手無寸.
教育学课程改革与资源建设 ——漫谈《教育学》(新编本) 张乐天
万方数据资源系统检索及利用 江南大学推广培训部 申佳慧.
痛并快乐着 ——新课改前行三年的心路历程 我—— 深圳宝安中学, 一名普通且年轻的历史教师。 我的追求—— 在历史的天空下,
万方数据资源的使用 图书馆技术咨询部.
基础与能力并重、 教师和学生同行 ——谈2014届高三历史一轮复习
從小王子到東坡愛花到凡爾賽玫瑰 ˙第一節課:小王子和玫瑰及相關問題、續書 ˙第二節課:東坡詞中的花? ˙第三節課:凡爾賽玫瑰介紹
马鞍山广播电视大学 工作站(教学点)网络图.
兩岸互動歷史 陸委會、海協會與九二共識.
打造平实有效的课堂 乐陵市实验小学 李升勇.
中州技術學院附設專科進修學校 榮民榮眷就學服務.
相聲啦咧 課程設計者: 斗六國中 沈美慧老師.
我不在圖書館, 就是在 往圖書館的路上 圖書館館長 韓柏檉.
大學法修正之前瞻與困境 楊朝祥 中原大學講座教授.
研究性学习课程实施策略 ——研究性学习36条建议
資訊科技挑戰獎勵計劃 樂善堂梁銶琚學校 6A(06)陳芷蘊 中華白海豚. 資訊科技挑戰獎勵計劃 樂善堂梁銶琚學校 6A(06)陳芷蘊 中華白海豚.
学位论文开题前的文献调查与检索.
商务谈判礼仪.
福建 简称闽,省会福州,省名取自福州府、建州府二府首字,“闽”是福建最原始的名称,闽字最早出现于周朝,闽与八闽,都是福建省的简称和别称。
哭泣的史瑞克.
中国社会科学院 财政与贸易经济研究所 副研究员 张斌 • 北京
影片鉴赏.
第二章 劳动法的概念、调整对象和适用范围.
做佃農贏過當地主, 15個年輕人的希望故事 家佳的讀書報告 荒地闖出百萬年薪.
时政热点专题复习 从历史角度看世博.
如何培養優良的下一代 親子教育系列—讀書心得報告 講題二.
逻 辑 学 主讲:李贤军.
天 狗 郭沫若.
走近文科综合考试 东营市一中 杨富民.
中国 中小企业发展战略 主讲:钟朋荣 北京视野咨询中心主任 兼任中央财经大学、中南财经大学、西北大学教授.
第八章 了解法律制度 自觉遵守法律.
第五章 教育目的 咸阳师范学院教育科学系李峰.
初中思想品德知识培训 ————初四第二单元《关注国家的发展》.
第 2 章 第一級產業 歷屆 基測試題.
——“手牵手——农村青少年阅读行动”全民读书活动的探索与思考
參考資料: 吳美美,Chap. 2-3 蔡明月,Chap. 2 卜小蝶,Chap. 2 Walker and Janes, Chap. 2
图书的特征: 除书名外,还有出版社、出版地、图书的总页数(PP),有时还有国际标准书号(ISBN).
上海梦:城市现代化历程 苏智良.
主要的動物---豬 近年來由於工商業起飛,各行各業如雨後春筍蓬勃發展,但農民的收入卻未因此而增加,因此養豬成為農民的主要副業,並逐漸佔居養豬戶農民的主要收入,全盛時期本地豢養豬隻超過五萬頭,但也相對衍生了許多廢水排放的污染問題。 所幸在有關單位的全力輔導下成立了養豬專業區,並設置了褒忠鄉潮厝養豬廢水共同處理場以處理本村及鄰近村莊.
Contents 万方知识服务产品体系 1 如何利用万方数字知识服务平台 2 检索实例及注意 3.
EBSCOhost 培训教程 海南大学图书馆咨询研究部.
电子资源的检索与利用 廖剑岚 图书馆参考咨询部 2017/3/19.
信息检索教材配套讲稿--邓发云.
主讲:钟朋荣 北京视野咨询中心主任 兼任中央财经大学、中南财经大学、西北大学教授
健康新路 第9课: 解决问题 大家好,很高兴我们又见面了,我们今天的课程题目是解决问题,本次课程在手册的45页。
《调酒与品酒》说课 说课人:陈基香.
经济全球化与对外开放 1.面对经济全球化 2.积极参与国际竞争与合作.
商業概論 第一章 緒論 第一節 商業的意義.
开放教育英语专科 专业导学.
第八單元 台灣當代舞團 林懷民與雲門舞集.
科教兴国 祖先烧过多少兴国的香火, 好儿孙有过多少兴国的求索。 昨天的兴衰震撼着今天的你和我 落后就要挨打的教训千万要记着。
The Principles and technology of Social sciences Information Retrieval
图书馆书目检索系统使用说明.
第七章 图书信息的网上检索 电子图书 中文图书信息的网上检索.
ProQuest Health & Medical Complete
不願面對的真相 心得報告 報告人:廖文楠
南宁翰林华府 ——地中海风格与现代住宅的融合.
“一九七九年,那是一个春天,有一位老人在中国的南海边画了一个圈,神话般地崛起座座城,奇迹般地聚起座座金山……”
教學構想與目的 本課程設計是以大一學生為對象,課程內容以銜接高三國防科技概論課程作規劃,著重於武器原理與性能介紹,同時並以我國現役武器裝備及世界尖端武器為對象,期使同學對國家之國防現況具有正確認知,並對現代化武器能有更深刻之體認;並據此認知與體認,以增進其對國防之信心,啟發其未來投入國防科技研究之興趣。
授課教師︰林孟璋 老師 報告學生︰周哲宇 學號︰ 日期︰2008/12/11
網路智慧財產權 著作權法.
Section 2-2: 4 (6), 7, 12 (14), 13, 18 (16), 21, 25, 28, 30, 36, 46, 48, 50, 54a Section 3-1: 4 (2), 5, 10, 15, 20, 29, 32 Section 4-1: 3, 7, 8,
Presentation transcript:

计算机检索的原理与 步骤 主讲人:董宁

介绍内容: 计算机检索概念和发展历程 计算机检索的基本概念 计算机检索的基本技术 计算机检索步骤 计算机检索的发展趋势

1.0 计算机检索概念和发展历程 1.1 计算机检索概念 计算机检索:是通过计算机(单机、网络)可以查找、利用各种信息资源。 1.0  计算机检索概念和发展历程 1.1 计算机检索概念   计算机检索:是通过计算机(单机、网络)可以查找、利用各种信息资源。 包括图书馆的公共书目(OPAC--Online Public Access Catalogue)、各种联机数据库、Internet上的信息资源等。

1.2 计算机检索的发展历程 脱机检索 联机检索 国际联机检索 单机光盘检索 光盘网络检索 Web信息资源检索

1.脱机检索(50年代末~60年代中期 ) 这时是计算机检索的原始时期。 只能进行简单的检索。 为满足专业检索人员定期批量处理用户的情报要求。 用户不能立刻获得检索结果。

2.联机检索(60年代末~70年代初) 1963年-1964年间,美国洛克希德导弹与宇航公司的情报实验室建立了”人-机“对话的联机情报检索系统(DIALOG的前身),此后在60年代末到70年代初联机检索系统得以快速发展。国际著名的DIALOG系统、ORBIT系统、MEDLINE系统都是从这个时期发展起来的。 用户可随时浏览检索结果 由于这个阶段的计算机网络主要是通过电话线联接,因而联机检索受到地区的限制

3.国际联机检索(70年代中期-) 卫星通讯技术的出现,使得联机检索系统打破了地域限制。而数据库生产的迅速发展及微机大量的涌现,更使得国际联机检索蓬勃发展。 联机检索系统进入发展的黄金时期。实现了人类情报资源的共享。

4.单机光盘检索(80年代--) CD-ROM技术促使计算机检索成本迅速下降 (一张光盘可存贮600〔MB〕兆字节机读数据、成本价格便宜,而一张DVD光盘的容量最少可达4.7G) 5.光盘网络检索(90年代-) 光盘网络是一种计算机网络,如图书馆局域网 实现多用户光盘资源共享

6. Web信息资源检索(90年代末-) 进入90年代后,随着网络技术的发展,尤其是互联网的迅猛发展,使计算机检索进入一个崭新的时期。 检索方法更简单,检索结果更全面

2.0 计算机检索的基本概念 2.1 信息检索 广义:信息检索是将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程。 2.0 计算机检索的基本概念 2.1 信息检索 广义:信息检索是将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程。 狭义:仅是指从信息集合中找出所需信息的过程。相当于人们所说的信息查询。 分类:根据检索手段的不同,信息检索可分为手工检索、光盘检索、联机检索和网络检索。

2.2 检索方法 检索方法(检索策略)是指根据现有的检索工具,能够省时、省力获取最佳检索效果而采用的检索顺序和途径。 包括:直接法、追溯法、综合法

2.2.1 直接法(常用法) 直接法是指直接利用检索工具(系统)检索文献信息的方法,这是文献检索中最常用的一种方法。它又分为顺查法、倒查法和抽查法。 顺查法 顺查法是指按照时间的顺序,由远及近地利用检索系统进行文献信息检索的方法。 例,已知某课题的起始年代,现在需要了解其发展的全过程,就可以用顺查法从最初的年代开始,逐渐向近期查找。

倒查法 倒查法是由近及远,从新到旧,逆着时间的顺序利用检索工具进行文献检索的方法。此法的重点是放在近期文献上。 2.2.2 追溯法(引文法)  追溯法是指利用已经掌握的文献末尾所列的参考文献,进行逐一地追溯查找“引文”的一种最简便的扩大信息来源的方法。 像滚雪球一样,依据文献间的引用关系,获得越来越多的内容相关文献。

2.2.3 综合法 综合法又称为循环法,它是把上述两种方法加以综合运用的方法。综合法既要利用检索工具进行常规检索,又要利用文献后所附参考文献进行追溯检索,分期分段地交替使用这两种方法。即先利用检索工具(系统)检到一批文献,再以这些文献末尾的参考目录为线索进行查找,如此循环进行,直到满足要求时为止。 综合法兼有常用法和追溯法的优点,可以查得较为全面而准确的文献,是实际中采用较多的方法。

2.3检索数据库 2.3.1 概念 数据库就是在计算机存储设备上按一定方式存储的相互关联的数据集合。是计算机技术与信息检索技术相结合的产物,是现代重要的信息资源,也是信息检索的重要资料来源。

2.3.2 分类 根据载体的不同,数据库可分为:联机数据库、光盘数据库、网络数据库 根据数据库的内容与功能不同,数据可划分为: ⑴全文数据库(full text database) 是存储文献全文或其中的主要部分的数据库。 ⑵书目数据库(bibliographic database) 是以文档的形式组织起来的、提供书目信息的数据库,包括各种目录、文摘与索引数据库。

(3)图像数据库(image database) 提供人们存储和检索图像及其文字说明资料的一种源数据库。 (4)交易(执行)数据库(transactional database) 是指各种用于交易的数据库,如股票、房地产交易数据库、中国科技成果交易数据库。 (5)专利、标准、会议录数据库

3.0 计算机检索的基本技术 3.1 布尔逻辑检索(boolean logic) 3.0 计算机检索的基本技术 3.1 布尔逻辑检索(boolean logic) 是当今检索理论中最成熟的理论之一,也是构造检索表达式最基本、最简单的匹配模式。布尔逻辑检索是通过布尔逻辑算符来实现的,这些运算符能把一些具有简单概念的检索词(或检索项)组配成为一个具有复杂概念的检索式,用以表达用户的检索要求。 逻辑运算符有三种:与(AND)、或(OR)、非(NOT) 逻辑运算符的优先顺序为NOT、AND、OR 如果要改变运算顺序需要用“()” A AND (B OR C)

3.2 邻近检索 又称位置运算检索。适用于两个检索词以指定间隔距离或者指定的顺序出现的场合。  常用位置运算符有(w)、(n)、(s)、(f) (W)算符中的W含义为“With”。 •词序不许颠倒 •两词之间不许插词,只允许出现空格或连字符号 例: solar ( w) energy 检出 solar energy

(N)算符中的N含义为“Near” •词序可以颠倒 •两词之间不许插词,只允许出现空格或连字符号 例:cross (N) section 可检出 cross section 和 section cross (S)算符中的S含义为“Sentence” •两词必须出现在同一句子(子字段)中

(F)算符中的F含义为“Field” •两词必须出现在同一字段中 •词序不限 例如: pollution (F) control 可检出control and management of industrial pollution 等等。

3.3 截词检索 截词检索就是使计算机保留检索词中的相同词干部分,允许检索词可有一定范围的变化。 截词有前方一致、后方一致和中间截词几种形式。 例: 前方一致:cat?,可检索出cat,cats,catalog,category… 后方一致: ?ther,可检索出mother,father 中间截词,只替代一个字符,允许检索词中间有若干变化。例如wom?n,检索到woman、women

3.4 字段限制检索 (field limiting) 字段限定也是调整检索策略的一种重要手段。 字段限制适用于在已有一定数量输出记录的基础上,通过指定字段的方法,减少输出篇数,提高检索的查准率。

常有的字段: 篇(题)名字段 TI=Title 文摘字段 AB=Abstract 叙词字段 DE=Descriptor 自由词字段 ID=Identified 著者字段 AU=Author 著者机构字段 CS=Corporate Source 刊名字段 JN=Journal 出版年字段 PY=publication Year 文献类型字段 DT=Document Type 语种字段 LA=Language 分类号字段 CC=Classification

用于改变运算的先后次序,括号内的运算优先进行。 例: 3.5 括号检索 (phrase search) 用于改变运算的先后次序,括号内的运算优先进行。 例: A AND (B OR C)

4.0 计算机检索步骤 确定检索目标 选择数据库 制定检索策略 上机检索 整理检索结果并对检索效率进行评价

确定检索目标 1.明确检索的目的 明确用户是要查新、查参考资料还是查询论文被收录或引用情况等,以便对检索的查准、查全和时间范围的指标要求有一个大致的了解,从而制定出符合情况的检索策略。 2.课题分析 对课题内容进行分析,找出核心概念和隐含概念,排除无关的概念,明确概念之间相互的逻辑关系。

选择数据库 根据检索目标分析所确定的检索目的、涉及的学科范围和信息类型,选择合适的数据库。 具体选择过程中还应考虑数据库的类型(参考、全文还是电子期刊)、内容(专利、标准、会议)、收录的数据学科范围、数据库的更新周期,收录文献的语种等因素。 例如,要看全文就要选用全文数据库或电子期刊;要查标准或专利就要选择标准库或专利库

制定检索策略 考虑运用顺查法,倒查法,追溯法,还是综合法 上机检索 (1)输出篇数过多时 此时多数是由误检造成的,原因主要有以下几点: 1)没有对检索词进行限制。包括字段限制,时间限制,分类限制等。 2)主题概念不够具体或具有多义性导致误检。例如,仅使用mathematics进行检索结果很多,将概念具体化。

如:mathematics and economic 再如,检索世界贸易组织仅输入“WTO”,系统可能会检索出“World Tourism Organization”(世界旅游组织) 3) 对所选的检索词截词截得过短。例如, 使用math? 将有太多的检索结果。

(2)输出篇数过少时 此时多数是由漏检造成的,原因可能有以下几点: 1)选用了不规范的主题词或某些产品的俗称、商品名作为检索词。 例如,没有使用学名“马铃薯”而使用了俗名“土豆” 又如,没有使用“表面活性济”而使用了商品名称“迪恩普”,都会造成漏检。 2)同义词没有充分考虑。 例如,“检索物理化学”,没有考虑到“物理有机化学”,“物化”等同义词,导致漏检。

5.0 计算机检索的发展趋势 可视化 相对于纯文本,图像的表达方式生动、形象,从多角度揭示主题。 简单化 多样化 (1)提供多媒体检索功能 5.0 计算机检索的发展趋势 可视化 相对于纯文本,图像的表达方式生动、形象,从多角度揭示主题。 简单化 多样化 (1)提供多媒体检索功能 (2)多语种检索 (3)服务多元化

个性化 例:Google在”My Preference”中根据用户个人偏好对检索用语种、网站语种进行设置,还可将检索范围限制在商业网站、教育网站、政府网站等域名中。 商业化 网络检索系统拥有全世界数量众多的用户,吸引了大量的广告,为电子信息的增值服务。网络检索系统已成为新的投资热点。