第7章 网络检索 7.1 互联网信息检索的特点 7.1.1 开放性 1 提供免费信息 2 提供有偿信息 3 在互联网上有许多交流式信息:如BBS等。 4 互联网的商业应用 5 TCP/IP协议的特点 6 互联网开放导致的问题
7.1.2 链接性 1 超文本 2 超媒体 3 超文本传输协议HTTP 4 超文本标记语言HTML 5 网址URL 7.1.3 简便性 互联网提供许多信息检索工具:E-mail、BBS、FTP、WWW等。
7.2 传统网络信息检索服务工具 7.2.1 远程登录Telnet 7.2.2 文件传输服务FTP 7.2.3 电子邮件E-mail 7.2.4 电子公告版BBS 武汉大学珞珈山水bbs http://bbs.whu.edu.cn/ 7.2.5 WWW 湖北大学 http://www.hubu.edu.cn/ 7.2.6 Web 2.0 维基百科http://wikipedia.jaylee.cn/
7.2 传统网络信息检索服务工具 7.2.7 基于Z39.50的信息检索服务 7.2.8 代理服务器和NAT 1、代理服务器的含义
7.3 搜索引擎 7.3.1 搜索引擎的类型 1 分类目录型搜索引擎(例如:网址大全) 2 全文检索型搜索引擎 4 图像搜索引擎 如:网址之家 http://www.hao123.com/ 2 全文检索型搜索引擎 如: http://www.baidu.com/ http://www.google.com.hk/ 3 多元集成型搜索引擎 如: http://www.1616.net中的集成功能 4 图像搜索引擎 如:中搜贴图http://bbs.zhongsou.com/picture.html 5 智能搜索引擎
7.3.2 搜索引擎的特点 1 使用方便:提供关键词检索、分类目录。 2 信息量大:综合性、百科性 3 检索方法多样 (1)简单检索—关键词检索 (2)布尔检索、截词检索、字符串检索、字段检索、位置检索、自然语言检索、概念检索等 (3)二次检索 (4)高级检索,如:http://www.google.com.hk/学术搜索 /徐锐 and 战略联盟知识共享的关系风险及其控制方式 4 检索结果形式多样
7.3.3 著名搜索引擎的使用 选择搜索引擎要考虑的几个因素: 1)收录范围 2)数据库的容量 3)用户界面 4)响应速度 5)更新周期 6)准确性与全面性
7.3.3 著名搜索引擎的使用 1 Yahoo: http://www.yahoo.com/ 7.3.3 著名搜索引擎的使用 1 Yahoo: http://www.yahoo.com/ Yahoo!目录体系: http://dir.yahoo.com/ Yahoo!搜索: http://dir.search.yahoo.com/
7.3.3 著名搜索引擎的使用 2 Google: http://www.google.com/ 7.3.3 著名搜索引擎的使用 2 Google: http://www.google.com/ 中文谷歌: http://www.google.com.hk/ 3 百度: http://www.baidu.com/ 4(搜狐)搜狗: http://www.sogou.com/ 搜狗网址导航: http://123.sogou.com/ 搜狗网址导航: http://dir.sogou.com/
7.3.3 著名搜索引擎的使用 5(新浪)爱问: http://iask.sina.com.cn/ 7.3.3 著名搜索引擎的使用 5(新浪)爱问: http://iask.sina.com.cn/ 6 天网搜索: http://www.tianwang.com/
7 其他搜索引擎 (1)常规搜索引擎 1)QQ搜搜: http://www.soso.com/ 2)网易有道: http://www.youdao.com/ 3)聪慧中搜: http://www.zhongsou.com/ 4)中华网中华搜索: http://sou.china.com/
(2)元搜索引擎 1)21世纪搜索网: http://www.21sosuo.com/ (3)提供自然语言检索功能的搜索引擎 1)AskJeeves: http://www.ask.com/ 2)中文搜索引擎一般都提供:自然语言检索
7.3.4 搜索引擎的局限 1 覆盖范围有限 2 索引速度有限 3 各种搜索引擎使用的检索符号和对检索式的要求不同 4 搜索引擎局限性的主要表现及其原因 5 改进方法:智能搜索、个性化搜索、本土化搜索等
第7章 课堂作业1 1、在搜狗上搜索“湖北大学附近的餐饮店”。 2、在搜狗上搜索“李彦宏”的博客。 3、在baidu上搜索“湖北大学校内1000元以下的出租屋”。 4、在baidu上搜索 “湖北大学2007年 ”申请或被批准的专利。 5、在Google上搜索 “湖北大学熊剑平2007年 ”发表的文章。
7.3.5 智能搜索引擎 (1)智能搜索引擎的含义及特征 (2)智能搜索引擎重视机器翻译技术、语义理解技术及其技术难点 (3)知识库、信息库、智能搜索引擎的关系 (4)智能搜索引擎使知识库与信息库结合 (5)智能搜索引擎的优点
1 数据挖掘DM (1)数据挖掘的含义 (2)网络数据挖掘及其步骤 (3)网络数据挖掘的类型 (4)网络数据挖掘的作用 2 知识发现KDD (1)知识发现的含义 (2)知识发现的过程(步骤) (3)知识发现与数据挖掘的联系 (4)面向WWW的知识发现KDW与面向单个数据仓库的知识发现的不同 (5)智能搜索引擎的发展
3 智能代理 (1)智能代理、主动服务、主动代理、机动的含义 (2)智能代理的特性 (3)用于信息服务的智能代理的主要功能
7.4 其他新兴的网络检索服务 7.4.1 博客和RSS 1 博客的含义 2 博客的类型 3 博客搜索引擎 (1)新浪博客搜索 http://www.sina.com.cn/ (2)搜狗博客搜索 http://blogsearch.sogou.com/ 4 RSS的含义 5 RSS的应用 6 RSS浏览器
7.4.2 维基Wiki 1 Wiki的含义、特点、目的 2 维基百科 3 中文维基百科 http://zh.wikipedia.org/ 4 维基百科的使用
7.4.3 P2P技术 1、P2P及Napster技术 2、P2P模式与客户机/服务器结构的区别 3、P2P的特点 4、全球著名的P2P软件,P2P文件交换总流量 电驴、BT、Guntella、KaZaa。 5、P2P进行交换的数字资源类型 MP3、电影、电视剧、电子图书。 6、P2P搜索引擎—还没有研究成功
7.5 中外著名网络数据库的检索 7.5.1 数据型数据库 1 数据 2 数据型数据库 3 数据型数据库的类型 (1)纯数值数据的数据库 (2)文本—数值数据库 例1: “中经专网 /行业频道”查“湖北上市公司”的有关数据。
7.5.2 事实型数据库 1 事实 2 事实数据库 3 事实数据库的主要作用 4 事实数据库的类型 举例: 在万方数据“成果”库中查“湖北大学顾豪爽”老师完成的成果。
7.5.3 文献型数据库 1 文献信息 2 文献检索的类型:书目检索、全文检索 3 书目检索的含义
CSA(剑桥科学文摘) 剑桥科学文摘(Cambridge Science Abstracts, CSA)包括60多个数据库,覆盖的学科范围包括:生命科学、水科学与海洋科学、环境科学、计算机科学、材料科学以及社会科学。检索结果为文献的题录文摘信息。主要包含以下子库: CSA Sciences CSA Computer Information and Technology Collection CSA Environmental Sciences & Pollution Management with AGRICOLA CSA Materials Science Collection with METADEX Technology & Information Collection with NTIS Aerospace Database Web Resources & Recent Reference Administration Profile 网址:http://csa.tsinghua.edu.cn
美国剑桥科学文摘—CSA\Quick Search Form.htm 美国剑桥科学文摘—CSA\Advanced Search Form.htm 美国剑桥科学文摘—CSA\Advanced Search knowledge management Results.htm 美国剑桥科学文摘—CSA\Advanced Search knowledge management Results.pdf 美国剑桥科学文摘—CSA\Command Search Form.htm 美国剑桥科学文摘—CSA\Combine Searches.htm
举例:在下列数据库中查找题名为“Information Retrieval”的信息 (1)湖北大学图书馆书目检索系统—书目查询 (2)湖北省科技文献共享平台 (3)CALIS西文期刊目次数据库(简称ccc.)
7.5.4 全文型数据库 (1)全文数据库的含义 (2)全文数据库的优点 1 光明网 http://www.gmw.cn/ 楚天都市报:http://ctdsb.cnhubei.com 武汉晚报:http://whwb.cjn.cn 2 中国期刊全文数据库CNKI(第5章已讲过) 3 中文科技期刊全文数据库-维普信息资源系统 举例:查找“湖北大学史金平”发表的文章
4 超星电子图书 举例:在“超星电子图书”中查找题名中包含“信息检索”方面的图书。 5 “百万图书”项目(CADAL)—大学数字图书馆国际合作计划(China Academic Digital Associative Library,CADAL) 举例:在此数据库中检索书名为“少年中国”的图书 6 纽约时报网 http://www.nytimes.com 举例:查找题名中包含“knowledge management”的文章
第7章 课堂作业2 1、在“中经专网”查找题名中包括“粮食”的文章。 2、在“万方数据”中查找2001年鉴定的“湖北大学王世敏”的成果。 3、在“万方数据”中查找2001年公布的“湖北大学王世敏”的成果。 4、在“维普信息资源系统”查找题名包括(1)“knowledge management”、 或(2)“technological innovation”的有关文章。 5、在“超星电子图书 ”中查找书名是“微观经济学” 的图书。
7 Elsevier数据库 举例: 1、在“Elsevier Science电子期刊”中,查找题名中包含“core competence”短语的期刊论文 。 课堂作业: 1、在“Elsevier Science电子期刊”中,查找题名中包含"sustainable competitive advantage"短语的文期刊论文 。 2、在“Elsevier Science电子期刊”中,查找湖北大学(Hubei University)顾豪爽(Haoshuang GU)2011年发表的期刊论文 。
举例: 8 Kluwer Online数据库(2000年,Springer与Kluwer学术出版社合并 ) (1)查找题名中包含"strategic alliances"方面的文章
举例:查找题名中分别包含下列内容的文章(有全文) 9 EBSCOhost数据库 举例:查找题名中分别包含下列内容的文章(有全文) 1、"dynamic capabilities" 2、"sustainable development in China" 课堂作业: 1、在EBSCOhost数据库中查找题名中包含China‘s SMEs的文章。 2、在“EBSCO全文数据库之Business Source Premier”中,查找2007年出版、题名中包含"core capability"短语、且检索结果都是全文的文章。
10 SpringerLink数据库 举例:查找题名中包含下列内容的文章: 作业: 1、 "strategic alliances" 1、在”德国SpringerLink数据库”中查找题名中包含 "knowledge acquisition"的文章; 2、在"德国SpringerLink数据库”中查找题名中包含 "Bullwhip Effect",且作者是"Rui Xu"的文章。
11 Wiley外文电子期刊 举例: 1、在Wiley中查找题名中包含"small and medium-sized enterprises"的文章。 课堂作业: 1、在Wiley中查找2013年发表的、题名中包含 "strategic alliances"的文章。
12国道外文专题数据库——顶级西文特色专题库 举例: 1、查找题名中包含China和"sustainable development"方面的文章。 课堂作业: 1、在“国道外文专题数据库”中查找题名中包含 electric commerce的文章。