Presentation is loading. Please wait.

Presentation is loading. Please wait.

“搜索——从这里起步” ——信息检索基础知识解析 龚芙蓉 武汉大学图书馆 龚芙蓉 武汉大学图书馆.

Similar presentations


Presentation on theme: "“搜索——从这里起步” ——信息检索基础知识解析 龚芙蓉 武汉大学图书馆 龚芙蓉 武汉大学图书馆."— Presentation transcript:

1 “搜索——从这里起步” ——信息检索基础知识解析 龚芙蓉 武汉大学图书馆 龚芙蓉 武汉大学图书馆

2 文献类型识别 检索技术 常用数据库检索实例

3 文献类型识别 文献类型(根据出版类型) 图书 期刊 科技报告 会议文献 专利文献 标准文献 学位论文 政府出版物 产品资料 档案

4 文献类型识别 J—期刊文章 M—专著 C—会议论文集 D—学位论文 R—报告 S—标准 P—专利 Z—其他未说明的文献类型

5 文献类型识别 例如: 林茂庸,柯有安.雷达分辨理论[M].北京:国防工业出版社,1982.123~125.
SamainD,DeMiguelI,MenialiJ,etal.BiodegradableParticulateDrugVector[P].PCTIntAppl.WO1992, 段成发.烷基多糖苷在洗涤剂中的应用前景[J].表面活性剂工业,1996,46(2):6~10.

6 文献类型识别 图书识别项: 出版项(出版地、出版社、出版年)、 ISBN(10位)、总页码(PP or P) 期刊的识别项:
卷号或期号(vol.no or v.n);刊名缩写(如PE&RS);ISSN号(8位) 会议文献识别项: 会议录名称、会议地点、会议时间、会议届次。 会议录名称常含有:congress(会议)、convention(大会)、symposium(专题讨论会)、workshop(专题学术讨论会)、seminar(学术研讨会)、conference(学术讨论会)colloquium(学术讨论会)、proceedings(会议录)

7 针对特定文献的原文检索——分析文献线索 科技报告识别项: 根据报告号 a、一般有report; b、有时候是表示报告类型的缩写词
PR(progress report)进展报告、AR(annual report)年度报告、 FR(final report)年终报告、CR(contract report)合同报告、 TR(technical report)技术报告 如 AFOS-TR1170;其中TR表示技术报告,1170表示顺序号。 学位论文识别项: 学位名称、大学名称。 如“dissertation”、”thesis”。

8 文献类型识别 专利文献识别项:patent;专利国别及专利号 标准识别项:标准号 如:ANSI TI

9 文献类型识别 图书 IPS international power systems. (1) R.G.Schwieger,T.C.Elliott,J.Reason, G.Paula,M.Leone(editor/s).(2) [New York,USA:McGraw Hill 2001](3)

10 文献类型识别 期刊 Document Storage System.(1) P.Bray(2)Which Comput.(UK) (3) Vol.14,No 5,p.37-42(Sept.1989)(4) ISSN O (5)

11 针对特定文献的原文检索——分析文献线索 会议文献 K.A.Chem, M.Fouer, K.H.Khokhani, N.Nan and S.Schmidt. .① “The Chip Layout Problems:An Automatic Wiring Procedure” ② .(Proceeding of the 15th Design Automation Conference 2001) ③ P ④

12 专利文献 科技报告 E.M.Engler and F.B.Kanfman.①
文献类型识别 专利文献 E.M.Engler and F.B.Kanfman.① “Reversible Electrochromic Display Device Hauing Memory” ② U.S.Patent ③ No.4,142,783,2001 ④ 科技报告 Some approaches to the design of high integrity software.(1) D.J.Marttin,R.B.Smith (2) (Combat Controls Div.GEC Avionics Ltd.Rochester,UK).(3)Report AGARD-TR 2584 (4)July 2001(5)

13 文献类型识别 学位论文 Guif of Maine sea Surface Topography from GEOSAT Altimery.(1)Lambert,Steven R.,(2) Ph.D(3)University of Maine(4) 标准 American National Standards Institute Integrated services digital network (ISDN) basic access interface for use on metallic loops for application on the network side of the NT (Layer 1 specification). ANSI TI , Sept.1988

14 检索技术 计算机信息检索的基本技术: 布尔逻辑、截词检索、字段检索,位置算符、精确检索等
布尔逻辑、截词检索、字段检索,位置算符、精确检索等    在进行计算机检索时,有时有一些比较复杂的课题,如:“GPS在建筑中的应用”,既涉及GPS,又涉及建筑,还有“应用”,这时候就要编制出满足要求的计算机检索式,它是机检的基础。

15 检索技术 1.布尔逻辑检索 (Boolean Logic Retrieval) 逻辑检索的基础是逻辑运算,逻辑运算中最常用的是布尔逻辑运算符(Boolean Logic Operators),即与、或、非三种运算符号,用它们可以表示概念之间的逻辑关系。

16 检索技术 检索要求 逻辑检索 课题 表达式 检索结果 概念相交、限定 AND与* 信息素养 教学 A B A AND B A * B
信息素养 教学 A B A AND B A * B 缩小检索范围 提高查准率 概念平行、并列 OR 或+ 土地管理与土地利用 A B A OR B A+B 扩大检索范围 提高查全率 某一主题去掉一部分相关主题 NOT非- 除光电测距以外的 A 电磁波测距 B B NOT A B-A 提高查准率

17 布尔逻辑 (Boolean Logic)“与”(“AND”)、“或”(“OR”)、“非”(“NOT”)
检索技术 布尔逻辑 (Boolean Logic)“与”(“AND”)、“或”(“OR”)、“非”(“NOT”) A and B and C A or B or C A and B not C

18 检索技术 2. 截词算符(Truncating operators) 在英语词汇中,一个词可能有多种形态,如词的单、复数形式的不同,英美拼写方法不同、词性不同等。如果检索时将这类词全部输入进去,会增加检索时间和费用,采用截词法可解决这一问题。

19 检索技术 所谓截词检索,是指在检索标识中保留相同的部分,用相应的截词符代替可变化部分。检索中计算机会将所有含有相同部分标识的记录全部检索出来。常用“?”、“*”符号表示。

20 检索技术 (1)有限截断。即在检索词后后截几个有限的字母,如名词的单复数,动词的词尾变化等。 如输入computer? ?表示有0-1个字母变化,可检出computer和computers. 输入stud???表示截断处有0-3个字母变化,可检出study,studies,studied,studing.

21 检索技术 (2)无限截断:在检索词后加一个“*“,表示该词后可加任意个字符。使用无限截词,所截词根不能太短,否则会输出许多无关文献,造成误检。 如:computer*可检出computers,computering,computered,computerization.

22 检索技术 (3)中间截断:在检索词中间加一个或几个?号,主要解决一些英美拼写不同,单复数形式的不同的词的输入,可简化输入。 如:输入wom?n可检出 woman,women

23 检索技术 3.括号检索(Parentheses) 用于改变运算的先后次序,括号内的内容做优先运算。 用“( )”可以表示优先级。如比较 (GPS OR GIS)AND China GPS OR GIS AND China

24 4、字段限制检索 组成数据库的最小单位是记录,一条完整记录中的每一个著录事项为字段。数据库的记录基本包括下列字段: (1) 存取号字段(AN, Access Number)这是计算机检索系统为每个数据库的每篇记录规定的能被计算机识别的特定号码。在同一数据库中,每篇文献记录只有一个存取号; (2) 篇(题)名字段(Title /TI) (3) 文摘字段(Abstract , /AB) 检索技术

25 检索技术 (4) 主题字段 (subject/Title/Abstract )这一字段是标引人员给文献标引的反映其主题概念的词,又称为复合字段。 (5) 叙词字段或受控词字段(Destriptor, /DE; 或 Controlled term -SU) 这一字段是标引人员给文献标引的反映其主题概念的词,这些词来自规范化的词表。 (6)自由词字段或非受控词字段(Identified /ID; Keyword /KW ;Uncontrolled term Field) 这一字段也是标引人员给文献标引反映其主题概念的词,但这些词不是规范化词表中的词。

26 (6) 著者机构子段(corporate source,CS或AF) (7) 刊名字段(journal,JN或ST) (8) 出版年子段(publication,year,PY) (9) 文献类型子段(ducument type,DT或TY) (10) 语种子段(language,LA) (11) 分类号子段(classification,CC)

27 基本索引子段和辅助索引子段 一篇记录中主要用来表达文献内容的子段称为基本索引子段(basic index fields),如篇名子段、文摘子段、叙词子段、自由词子段。
表达文献外部特征的子段称为辅助索引子段(additional index fields),包括著者子段、著者机构子段、文献类型子段、语种子段等。

28 5、短语检索(phrase search)即精确检索 短语用“”表示,检索出与“”内形式完全相同的的短语,以提高检索的精确度和准确度

29 实际检索中,往往将多种检索技术混合使用。如:查找标题中含有“网络营销”的资料,它的计算机检索提问式(表达式)可以是: TI(Web OR WWW) AND market*

30 CPCI中的综合表示方法 TS=(nanotub* SAME carbon) NOT AU=Smalley RE

31 数据库的一般使用方法 浏览 browse 1)出版物名称publications 字顺(alphabetical)、2)按学科discipline、3)按主题subject、4)按出版社publisher浏览 检索search 简单检索basic seach, quick search 高级检索advanced search 专家检索expert search 个性化功能 同义词、高频检索词、叙词表等辅助选择检索词的功能 邮件通告 参考文献管理软件导出 ......

32 常用数据库检索

33 Web of Science核心合集 Science Citation Index Expanded(科学引文索引,SCIE): ~8473种核心期刊,可回溯到1899年 Social Science Citation Index(社会科学引文索引,SSCI):~3031种核心期刊,可回溯到1898年 Arts & Humanities Citation Index(艺术与人文引文索引,A&HCI): ~1671种核心期刊,可回溯到1975年 Conference Proceedings Citation Index - Science (CPCI-S) 至今 Conference Proceedings Citation Index - Social Science & Humanities (CPCI-SSH) 至今

34 引文索引 Dr. Garfield 1955年在 Science 发表论文提出将引文索引作为一种新的文献检索与分类工具。将一篇文献作为检索字段从而跟踪一个Idea的发展过程 1963年出版 Science Citation Index 1973年出版 Social Sciences Citation Index 1978年出版Arts & Humanities Citation Index Dr. Eugene Garfield Founder & Chairman Emeritus  ISI, Thomson Scientific “Our ultimate goal is to extend our retrospective coverage of the scientific literature back to the twentieth century. The Century of Science initiative makes that dream come true.” 引文索引系统打破了传统的学科分类界限,既能揭示某一学科的继承与发展关系,又能反映学科之间的交叉渗透的关系 34 34 34

35 从一篇高质量的文献出发 沿着科学研究的发展道路 分析: 学科分布、发展趋势、机构/作者等 Cited References 越查越深
2004 2003 Times Cited 2003 1998 2004 Cited References 分析: 学科分布、发展趋势、机构/作者等 1995 Related Records 1993 1991 2004 1980 2002  Citing  1999 Cited References 越查越深 Times Cited 越查越新 Related Records 越查越广 1994

36 例1 Jiang, HM; Qin, YC; Hu, B,Dispersive liquid phase microextraction (DLPME) combined with graphite furnace atomic absorption spectrometry (GFAAS) for determination of trace Co and Ni in environmental water and rice samples,TALANTA, 74 (5): FEB ,以上这篇文章的被引频次(不排自引)

37

38 常用中文数据库检索实例 1、如何在检索结果中挑选高质量的文献;(文献管理与评价) 2、选择检索词的辅助方法(数据库的个性化功能)

39 篇名=(农业+农村+农产品+农用生产资料)*(电子商务+B2B+B2C+C2C)

40 篇名=(农业+农村+农产品+农用生产资料)*(电子商务+B2B+B2C+C2C) 精选文献

41

42

43

44 谢谢大家! 龚芙蓉 电话:


Download ppt "“搜索——从这里起步” ——信息检索基础知识解析 龚芙蓉 武汉大学图书馆 龚芙蓉 武汉大学图书馆."

Similar presentations


Ads by Google