Presentation is loading. Please wait.

Presentation is loading. Please wait.

第十章 主题语言在网络资源组织中的应用.

Similar presentations


Presentation on theme: "第十章 主题语言在网络资源组织中的应用."— Presentation transcript:

1 第十章 主题语言在网络资源组织中的应用

2 主题语言在网络资源 组织中的应用 网络信息的特点 主题语言在网络资源组织中的应用 网络信息组织方式

3 网络信息的特点 数量多,增长快,传播速度快 信息种类繁多:文本、图形、声音 网民有专门需求,要求信息组织方式透明化、易用化
信息形式的非线性、交互性和动态性 网络信息组织不能完全照搬传统的信息组织方式

4 主题语言在网络资源 组织中的应用 主题法是网络资源信息组织的一种主要模式。 在网络资源组织中,主题法的使用一般分为两种形式:
采用现有的词表,包括叙词表和标题表 广泛采用关键词法

5 关键词法在搜索引擎中的应用 主题语言在网络信息组织中的应用目前主要表现为关键词语言在网络搜索引擎中的广泛应用。
几乎每一个搜索引擎都具有关键词检索功能,这意味着搜索引擎的索引数据都采用了关键词法进行信息组织,也就是从网站、网页的题名、地址、摘要,甚至网页的正文中抽取关键词作为索引词。

6 关键词法在搜索引擎中的应用 不同搜索引擎提供的关键词检索功能不同,说明它们对关键词法的应用有一定差异。
网络搜索引擎的关键词检索功能:简单查询、高级查询。

7 简单关键词查询 直接在查询框中输入一个或多个关键词,系统按照自己的规则可能会将输入的关键词分解为几部分,并将包含每部分字符的信息都显示出来,也可能查出字面相同但内容相差很远的信息。 中文关键词查询以单汉字检索技术为基础时,获得的查询结果与查询要求可能相差更远。

8 高级关键词查询 布尔查询:大多数搜索引擎具有该功能,有的允许逻辑与、逻辑或、逻辑非三种逻辑运算,有的只能进行其中的一两种逻辑运算。大多搜索引擎采用命令方式,如AND、OR、NOT,或+、-,或将关键词之间的空格默认为逻辑与、逻辑或,有些用菜单选项进行。

9 高级关键词查询 精确查询:又称词组查询,将一个词组当作一个独立的运算(往往用双引号括起来),进行严格匹配,以提高查准率。

10 高级关键词查询 模糊查询:又称概念查询,不仅根据输入的关键词查询,而且会自动地用关键词的同义词、近义词进行查询,提高查全率。检索系统需配备相当于后控制词表的同义词、近义词词表。

11 高级关键词查询 截词查询:在搜索引擎中,目前大多只提供右截断法,截词符多采用“*”。
位置查询:目前只有少数搜索引擎具有该功能,而且大多数只有一种邻近位置运算,即Near运算。

12 高级关键词查询 字段查询:将关键词查询限定在特定字段。搜索引擎中,字段查询多表现为限定前缀的形式。主要限定的字段有:题名(title)、URL、主机名(host)、域名(domain)、链接(link)等。可提高查准率。

13 高级关键词查询 限制查询:将关键词限制在特定信息范围内进行查询。限制的信息范围主要有网络系统,如Web、Newsgroup、 等;信息类型,如文本信息、图像信息、声频信息等;时间段及语种等。

14 高级关键词查询 管道查询:用管道符号“|”连接两个或多个关键词,查询时系统自动地先对前一个词进行匹配,然后在其基础上再对后一个词进行匹配,依次类推,以达到逐渐缩小检索范围,提高查准率的效果。

15 高级关键词查询 区分大小写查询:有的搜索引擎能够区分检索词的大小写,将同一个词大写形式和小写形式视为不同的词进行查询。
自然语言查询:用户可直接用自然语言的字、词、句子作提问式,系统可以自动分析提问的要求,识别需要查询的关键词及词间关系。自然语言查询使检索变得直接、简单,特别适合非专业的检索者。

16 现有主题词表 在网络资源组织中的应用 目前,适用现有主题词表组织网络信息资源的还不多,主要是美国《国会图书馆标题表》(LCSH)和《医学主题词表》(MeSH)。

17 现有主题词表 在网络资源组织中的应用 采用LCSH:
InterCat: A Catalog of Internet Resource (OCLC); Canadian Information By Subject(Library and Archives Canada)

18 现有主题词表 在网络资源组织中的应用 采用MeSH的有:
CliniWeb Browse (Oregon Health Sciences University) OMNI (Organizing Medical Networked Information)

19

20

21

22

23 网络信息组织方式 文件方式:按文件名存取 数据库方式:结构化数据集合 主题树方式:分门别类,逐层组织
搜索引擎方式:主要组织方式。自动对网络资源采集、标引和检索。著名的搜索引擎:Google、Alta Vista、百度等。

24 主题标引内容回顾 绪论:主题检索语言 标引词表及标引工具书 标引一般原则与步骤 组配原则 特征词

25 主题标引内容回顾 副主题词 主题词标引 中医药文献主题标引 自动标引 主题语言在网络资源组织中的应用


Download ppt "第十章 主题语言在网络资源组织中的应用."

Similar presentations


Ads by Google