信息获取的一般过程 因特网信息的查找 文件的下载 网络数据库的信息检索 第二章 信息获取 信息获取的一般过程 因特网信息的查找 文件的下载 网络数据库的信息检索
2.1 信息获取的一般过程 调整 确定信息获取方法, 获取信息 定位 信息需求 选择 信息来源 评价信息
剖析信息获取的各个环节 定位信息需求 信息的时间范围 when 信息的地域范围 where 信息的内容范围 what
运动会、动物园、销售市场、各类公共场所及事件发生现场 选择信息来源 类型 例子 优点 不足 文献型信息源 报纸、期刊、公文、报表、图书、辞典 全面、系统、可靠、清晰、明确 编辑、印刷、发行等需要较多时间,信息比较滞后 口头型信息源(个人信息源) 同学、朋友、亲戚、父母、老师 灵活、方便 信息带有主观成分 电子型信息源 广播、电视、电话、因特网 更新快、范围广、易复制、生动、直观 需要一定的设备 实物型信息源(现场信息源) 运动会、动物园、销售市场、各类公共场所及事件发生现场 直观、真切 信息零星、表面,往往稍纵即逝
不同的信息来源各有其特点和优势; 不同的信息来源相互结合、相互补充、共同发展,为用户提供良好的信息服务 问题:个性化电脑的配置,可以选取什么的信息来源获得?
确定信息获取方法 观察法、问卷调查法、访谈法、手工检索、计算机检索等
评价信息 评价信息的依据:数量、适用性、载体形式、可信度、时效
实践: (1)独立完成:P16表2-2各种传播媒体的特点 (2)小组协作完成P17表2-3信息获取情况表。 要求:以寻找培正的故事作为信息需求。
2.2 因特网信息的查找 2.2.1 搜索引擎(Search Engine) (1)搜索引擎的发展历史(阅读光盘资料) 2.2 因特网信息的查找 2.2.1 搜索引擎(Search Engine) (1)搜索引擎的发展历史(阅读光盘资料) (2)搜索引擎的工作原理 (3)搜索引擎的类型
搜索引擎的工作原理 WWW站点 Usenet站点 网 巡视程序 络 (或人工采集) Gopher站点 数据库 FTP站点 用户系统 网 络 检索代理软件
按其工作方式划分: 全文搜索引擎:关键词检索方法 如:google、百度、北大天网等 (P19表2-4) 目录索引类搜索引擎:分类目录检索方法 如:雅虎、新浪、搜狐、网易等 元搜索引擎:辅助工具
全文搜索引擎(一) 使用自动索引软件来发现、收集并标引网页,建立数据库。它的Spider自动在因特网上漫游,不断搜集各类新网址及网页,形成数以千万乃至亿万条记录的数据库;它以Web形式提供给用户一个检索界面,供用户输入检索关键词、词组或短语等检索项,以其特定的检索算法代替用户在其数据库中找出相关记录,按相关度排序输出。
全文搜索引擎(二) 收录、加工信息的范围广、速度快,能及时地提供新增信息给用户。 每个搜索引擎都提供了多种检索功能 ,有利于提高检索效率。 适合于检索特定的信息及较为专、深、具体或类属不明确的课题。 一次检索输出的结果可能很多,但当中包含了许多重复、虚假的信息 ,因此要过滤一大堆与检索主题互不相干的检索结果。
目录索引类搜索引擎(一) 一般采用人工方式采集和存储网络信息,是由专业人员在广泛搜集网络资源及有关数据,进行加工整理,按照某种主题分类体系编制的一种可供检索的等级结构式目录 。 在每个目录大类及其子类下提供相应的网络资源站点地址,并附有简单的介绍。用户能在目录体系的引导下,通过浏览目录,逐级查找,检索自己感兴趣的主题。
目录索引类搜索引擎(二) 比较适合用户进行笼统或较笼统的主题浏览和检索。 查准率较高,查全率较低。 适合查找综合性、概括性的主题概念,或对检索准确度要求较高的课题。 专题指南的局限性在于其信息更新速度慢,跟不上网络信息的发展。 数据库的规模相对较小,收录的网页数量和深度都相对不足,用户很难检索到较专深的信息,比较容易遗漏交叉相关信息 。
2.2.2 搜索技巧 确定关键词(同义词、近义词);多个关键词结合,细化搜索条件 选好工具(不要只用一个搜索引擎,多个结合) 2.2.2 搜索技巧 确定关键词(同义词、近义词);多个关键词结合,细化搜索条件 选好工具(不要只用一个搜索引擎,多个结合) 找“帮手”(查看搜索引擎的帮助) 用好AND、OR、NOT或+、-、|号等布尔逻辑命令;使用强制搜索
1、世界的四大红茶是什么? 2、小明的地理老师布置了一道很复杂的作业:位居世界第二的高峰和位居世界第二的洼地高低落差多少米?谁能帮帮他。 3、请问被苏轼赞为“诗中有画,画中有诗”的人是谁?
4、查找《谁动了我的奶酪》的英文原文。 5、查找《再别康桥》的英文译稿。 6、最近听朋友说有个Flash作品叫做“东北人都是活雷锋”非常有意思,想上网找来看看。(用关键词检索法查找)(用分类目录检索法查找)
7、中国一些历史悠久的中药店,都喜欢叫“某某堂药店",象“同仁堂”、“九芝堂”、“达仁堂”……那么,人们是为了纪念哪位医生才这么叫的呢? 8、什么是19世纪末产生于美国新奥尔良的流行音乐,主要起源于黑人劳动歌曲、散拍音乐、灵歌、布鲁斯等。
9、2008年第29届奥运会将在北京举行,那么,大家知道奥运五环旗中的红色环代表哪个洲吗? 10、路由器是一种连接多个网络或网段的网络设备,请问它工作在OSI的哪一层?
11、味精的鲜味来自谷氨酸钠,它最早发现于什么汤中? 12、我们伟大的毛主席曾经写道:“橘子洲头,看万山红遍,层林尽染……”,请问这是描写什么地方的风景?
13、上海的黄先生某日看了一个个人画展,其中两幅画印象深刻,一幅叫《种引牵牛上短篱》,还有一副叫《芭蕉过雨绿生凉》,黄先生听说这位画家是位加拿大的华裔,你能找到这位画家的姓名吗?
14、“生命在于运动”,是哪位法国著名思想家的名言,这句话不仅道出了生命活动的基本规律,同时也为人们指明了预防疾病、消除疲劳、获取健康长寿的重要途径。
15、每天,形形色色的人,在世界不同的角落里,等待一杯好咖啡。 随着第一粒咖啡豆被人们采摘下来、第一次焙考、第一次研磨、第一次冲调和第一杯热咖啡醇香的飘散,有关咖啡种植和咖啡文化在我们这个小小的星球上传播的传说,已经成为历史上最伟大、最浪漫的故事之一。请问中国大陆地区首次种植咖啡树是在哪个省?
2.3 文件的下载 2.3.1 文件及其文件类型 文件名:<文件主名>.<扩展名> 2.3 文件的下载 2.3.1 文件及其文件类型 文件名:<文件主名>.<扩展名> 文件类型:可执行文件+数据文件 可执行文件类型:exe、bat、sys、 dll 、ini 、hlp等 数据文件类型:html、txt、doc、ppt、xls、pdf、bmp、jpg/jpeg/tiff、gif、swf、rm、zip、rar、等
存储位置:文件的具体位置 内容、修改日期、只读、存档、隐藏、大小 URL路径:<协议>://<主机域名>/<路径>/<文件名> UNC路径:\\<计算机名>\<路径>\<文件名> 本机路径:<文件所在的盘符>:\<路径>\<文件名> 内容、修改日期、只读、存档、隐藏、大小
2.3.2 多途径下载文件 FTP 专题网站 厂商网站
2.3.3 下载工具 通用下载工具 网站下载工具 FTP下载工具 流媒体下载工具 其他专用
因特网上的软件种类 免费软件:指那些没有任何版权限制,可以随意使用和散发的软件。很多免费软件甚至附带了编制软件的源程序代码,以供其他用户在此基础上进行修改和提高。但值得注意的是,任何人在免费软件基础上开发的软件也是免费软件,不能用于商业销售。 如:Linux、Internet Explore
共享软件(Shareware): 指在一定条件或一定时间范围内可以免费试用的软件,在这期限内对软件的使用有一定的功能限制。过了试用期后,一般要求用户购买、注册,以继续无限制地使用。 有一些共享软件试用期间会经常弹出提示你注册的对话框,另一些共享软件在试用期间在最重要的功能上受到限制,还有一些软件过了试用期限,如果不注册就不能继续使用了。共享软件主要是为了达到演示自己产品,鼓励你购买正式产品的目的。
演示软件 : 与共享软件很相似,它是为了演示自己的软件产品而开发的。演示软件通常和正式软件在使用上完全相同,但是会有一些重要限制,例如不能保存文件、不能打印,或者在最后的结果中有某种标记(例如水印)等。 共享软件在试用期之内通常可以完成某些功能,例如CuteFTP在共享期内确实可以用于下载文件。而演示软件一般什么也干不了,只能起到演示作用。
升级与补丁软件 : 现代的软件业竞争越来越激烈,所以大多数软件公司都没有经过充分测试就推出了自己的产品,从而导致软件产品正式发布后还会出现各种各样的毛病。 为了解决这些问题,大部分公司都会不断推出各种各样的升级软件和补丁软件,以弥补软件产品中的毛病、改善某些功能。大部分升级和补丁软件都是免费的,但是也不一定,这和出品软件的公司的具体政策有关。这些升级和补丁软件通常都可在软件出品公司的网站中寻找到。
0-Day软件 : 如果你从Internet中下载并安装了该软件,那么必须在24小时之内从硬盘上删除掉,或者说你使用软件的时间不能超过1天。 0-Day软件通常是大型的商业软件和专业软件,几乎全世界出品的任何商业软件,例如Windows 2000,Office 2000,Photoshop 5.5,Dreamweaver 3,3D Studio MAX R3等,在软件发布后一周之内都会作为0-Day软件出现在Internet上。 0-Day软件只用于教育用途,它的存在是完全合法的,注意不要和盗版软件混为一谈。
2.4 网络数据库的信息检索 优点: 专业性较强、主题明确、检索的相关性非常高 经过专家严格的定向筛选、质量较高、具有较高的权威性 2.4 网络数据库的信息检索 优点: 专业性较强、主题明确、检索的相关性非常高 经过专家严格的定向筛选、质量较高、具有较高的权威性 存取的效率比较高、故障率较低
多样化的网络数据库: 教育资源库 学术类 在线图书馆 娱乐类的数据库 网上商场 数字城市
实践: 给自己提一个问题,并且利用网络数据库的资源回答自己所提的问题。(仿照P33实践题)
Tips: 图行天下:www.go2map.com 中国城市网络数据中心:www.chinacsw.com/sjk 中国期刊网:www.cnki.net/index.htm 万方数据库:www.wanfangdata.com.cn 中国大百科全书:www.ecph.com.cn
中国国家图书馆:www.nlc.gov.cn 上海图书馆:www.libnet.sh.cn CNKI中小学多媒体数字图书馆:www.cfed.cnki.net 超星数字图书馆:www.ssreader.com 数字北京:www.digitalbeijing.gov.cn