4.4.1 因特网通信服务 (电子邮件、即时通信、文件传输) 4.4.2 WWW信息服务 (WWW组成、Web信息检索、Web信息处理) 4.4 因特网提供的服务 4.4.1 因特网通信服务 (电子邮件、即时通信、文件传输) 4.4.2 WWW信息服务 (WWW组成、Web信息检索、Web信息处理)
因特网提供了丰富的服务 电子商务 P2P内容下载 电子邮件(E-mail) 博客/微博(Blog、MicroBlog Twitter) IP电话(skype) 影视网(YouTube) 网络社交(人人网、开心网、FaceBook) 电子邮件(E-mail) 信息服务(WWW) 文件传输(FTP) 网络论坛(BBS) 即时通信(IM) 门户网站(Portal) 网络游戏 个人主页
我国使用最多的若干网络服务 我国使用率最高的网络服务排名: 信息服务 网络音乐用户达3.5亿使用率为82.5% 网络新闻用户增至3.3亿 使用率为78.5% 搜索引擎用户规模达3.2亿 使用率增至76.3% 即时通信用户3.04亿(手机即时通信用户2585万) 网络游戏用户达2.96亿 网络视频用户2.65亿 使用率升到63.2% 电子邮件用户2.35亿,使用率升到56.5% 博客用户增至2.31亿 社交网站网民规模达2.1亿 网络购物、网上支付和网上银行的用户分别达到1.42亿、1.28亿、1.22亿,增长率均在30%左右,远超其他类网络应用 信息服务 通信服务 交易服务
4.4.1 因特网通信服务 1 电子邮件 2 即时通信 3 文件传输
Internet 通信服务 因特网可以提供下列不同形式的通信服务: 同步通信与异步通信的区别: 电子邮件 博客(Weblog) 专题讨论 即时通信(Instant messaging) IP电话 同步通信与异步通信的区别: 同步(实时)通信,要求通信双(多)方同时在线 异步(非实时)通信,通信双(多)方不必同时在线 异步通信 同步通信
电子邮件(E-mail)的特点 电子邮件与传统邮政服务的区别: 特点: 使用电子文档代替纸质文档 使用网络传输代替人工投递 快捷性 方便性(在任何地方均可接收和发送邮件) 不受时区影响 可使用多媒体表示邮件内容 具有地址簿功能, 群体通信极为方便 可提供免费服务(HotMail Gmail Yahoo等) 可使用计算机管理邮件(整理、编辑、归档)
电子邮件如何开通? 向某个电子邮件服务提供商申请开户,在开户的电子邮件服务器中获得一个属于自己的电子邮箱 每个电子邮箱都有一个惟一的地址,邮箱地址由两部分组成,如: xyzwer@netra.nju.edu.cn 邮箱名 用来确定邮件服务器中邮箱 邮箱所在邮件服务器的域名 用来确定接收/发送邮件的邮件服务器 在客户计算机中安装并运行电子邮件程序(如Outlook Express, Foxmail等),用户即可收、发、阅读或删除邮箱中的邮件
电子邮件的组成 1. 邮件头部,包括:发信人地址、接收人地址(允许多个)、 抄送人地址(允许多个)、主题 66662345 yds 1. 邮件头部,包括:发信人地址、接收人地址(允许多个)、 抄送人地址(允许多个)、主题 2. 附件中可以包含一个或多个文件,文件类型可以任意 3. 邮件的正文,可包含文本和图像,文本可以使用不同的编码字符集 (电子邮件协议:MIME)
邮件可以包含多媒体信息 电子邮件的内容采用MIME协议,因而邮件中可以包含中西文字、图片、声音等多媒体信息 101100110001 100011001001 010011000110 100101000...
电子邮件的工作过程 电子邮件系统按C/S模式工作。发送邮件一般采用SMTP协议,若收信人邮件地址不存在,则退回信件并通知发信人;接收邮件采用POP3协议,需验证用户身份之后才能读出邮件或下载邮件 发信人计算机 邮件撰写 程序 邮件发送 收信人计算机 邮件阅读 邮箱访问 因 特 网 收信人邮件服务器 邮件 发送 队列 收信人 邮箱 收到的邮件 POP3协议 发送的邮件 SMTP协议 发信人邮件服务器 发信人 ?
电子邮件使用须知 管理好邮件: 如果想让发出去的信息被认真对待,请表现出最好的一面,又不要过于花哨 定期接收邮件,阅读后删除不重要的邮件 充分发挥计算机潜力,对邮件进行过滤,分类存放保留的邮件;发送邮件时自动签名等 简短、扼要、主题明确,保存重要信件的副本 不必回复每一个邮件 使用电子地址簿保存重要邮件的地址(因为邮件地址很难记,难以保证输入完全正确) 如果想让发出去的信息被认真对待,请表现出最好的一面,又不要过于花哨 不要与他人共用同一邮件地址,口令不告诉他人,口令要经常改变,并保存在安全处 未经杀毒软件检查,不要打开邮件的附件,不要把e-mail 阅读器配置成自动打开附件 不要回复垃圾邮件, 骚扰邮件, 攻击邮件或邮件链 当心phishing(fishing)邮件, 个人信息要保密,电子邮件有点像传统明信片,写个人隐私就是傻子 不要发送垃圾邮件
注意电子邮件的负面作用 电子邮件系统的脆弱性(因機器故障、網路失靈、人為失誤、安全漏洞而出問題) 对个人隐私有威胁 警惕电子邮件欺诈行为 防止“中毒”和“中马” 垃圾(广告)邮件泛滥 失去了许多“人性”成分
即时通信的工作过程 例:QQ的工作过程 (C/S工作模式) 2. 服务器判断有您的哪些朋友、家人、同事(称为伙伴)已经在线,并通知您知道 1.登录到 即时通信 服务器 4消息也可通过P2P方式直接发给您的伙伴 5. 您的伙伴立即就能看到 您发的消息 3. 给在线的 伙伴发消息 4. 消息由服务器立即转发给您的伙伴
常用即时通信系统 流行的IM系统: ICQ,腾讯QQ,MSN,雅虎通,网易POPO,Google的G-talk、EBAY的Skype,新浪UC,盛大圈圈 主要功能: 文本/语音/视频聊天,多人聊天;可搜索聊天记录 向手机用户发送短消息(飞信) 文件传输 精彩新闻 共享网络资源 网络电台和在线音乐播放 扩展至手机即时通讯 意义:使人们的沟通突破了时空界限、阶层界限、环境界限、心理界限…… ,是现代交流方式的象征 存在问题:还不能互联互通! 多任务处理 异步通信 长短沟通 媒介转换迅速 交互性 不受时空限制 可再现性
文件传输FTP
什么是文件传输(FTP) ? 把网络上一台计算机中的文件移动或拷贝到另外一台计算机上,称为远程文件传输,简称FTP FTP的作用: 不同的操作系统,如Windows与Unix(Linux), 其文件系统不同, 文件命名规则和存取权限规定等均有区别 FTP实际上是一种协议——文件传输协议, 使用该协议进行文件传输操作就能解决不同计算机中文件系统不兼容的问题 什么时候使用FTP? 用户要从自己的计算机向另一台计算机传输文件(使用浏览器无法上传文件) 两台计算机需要相互传输多个文件(使用浏览器只能一个一个文件下载)
FTP服务的组成 FTP服务也采用客户/服务器工作模式: FTP客户机与FTP服务器之间需要建立2个连接: FTP 客户机: 运行FTP客户程序(如cuteftp, leapftp, flashfxp, windows的fpt.exe)的主机 FTP 服务器: 运行FTP服务器程序(如servu, ftpd, wu_ftp)的主机 FTP客户机与FTP服务器之间需要建立2个连接: 控制连接——传送客户发出的命令和服务器的应答消息 数据连接——传送文件数据 FTP 客户程序 服务器程序 FTP客户机 FTP服务器 控制连接 数据连接 因特网
如何进行FTP? 有三种途径可以进行FTP: 使用windows自带的ftp.exe 程序 从开始菜单通过”附件”=>”命令提示符”进行 使用IE浏览器 在IE地址栏中输入如下格式的URL地址: ftp:// [用户名:口令@] FTP服务器域名 安装并运行专门的FTP客户程序 例如LeapFTP、CuteFTP、WSFTP等,它们都是专门用来连接FTP服务器的应用程序,提供了图形化的用户界面
使用公开账号访问FTP服务器 许多FTP服务器需要预先注册并获得授权后才可以进行访问 公开账号: anonymous 口令: 用户的电子邮箱名 寻找FTP网站的方法: 通过IE浏览器,利用FTP搜索引擎在网上进行搜索 北大天网是有名的FTP搜索引擎之一
4.4.2 Web信息服务 (1)WWW的组成 (2)Web信息检索 (3)Web信息处理系统
什么是WWW? WWW(World Wide Web)原先是Internet的一种信息服务,有人译作万维网、环球网,或称Web网、3W网,由欧洲核物理研究中心(CERN)提出 功能: 最初的功能:信息服务——查找资料、交换文档、获取信息资源 扩展的功能:信息处理——电子商务、电子政务、几乎各种网上应用 组成: 物理上:大量客户计算机 + 大量Web服务器(大约1亿网站、630亿网页) 技术三要素: WWW是遍布全球的网站互相链接而成的一个信息网络(空间),用户可以方便地浏览、查找和下载其中的网页(信息资源) HTML——超文本标记语言,用于描述网页 URL ——统一资源定位器, 指出请求的服务和网页的地址 HTTP——超文本传输协议,用于客户机与服务器之间通信
网站(Web site)和网页(Web page) 通过Web服务器发布的信息资源称为网页,服务器中相关网页组合在一起构成一个网站,网站由Web服务器管理 网页可包含文本、图片、声音、动画等,多数网页是一种采用HTML语言描述的文档(HTML文档),其文件扩展名为html或htm。 网页是一种超文本文档,它支持超链(Hyperlink)。网页通过超链相互链接,形成网状的信息空间 网站 主页 超链 网页 URL 网站中的起始网页称为主页(homepage),用户通过访问主页就可直接或者间接地访问网站中的其他网页 每个网页都有1个唯一的地址——统一资源定位器URL (Uniform Resource Locator)
网页和HTML文档 存放在Web服务器中可以被下载到客户浏览器上进行阅读的文档,可以统称为“网页” 网页可以是各种类型的文档,如HTML文档、DOC文档、PPT文档、PDF文档、···,但主要是HTML文档 HTML文档是使用超文本置标语言(Hyper Text Markup Language,HTML)表示的超文本(超媒体)文件,文件后缀为html或htm 网页可使用专门的软件如FrontPage、 DreamWeaver进行制作,也可以使用Word、Excel、PowerPoint等软件制作,或者从.doc或.ppt文档转换而成
选讲: HTML文档的格式 HTML文档是使用HTML语言描述的标准的超文本文档,大多数网页都是HTML文档,它由两个部分组成: <HEAD> <TITLE> 网页的标题 </TITLE> </HEAD) <BODY> 网页的正文(包括文字、超链以及格式描述) <IMG SRC="图片的文件名"> </BODY> </HTML> HTML文档与doc文档、pdf文档一样,文档中可以包含文字、表格、图片、声音,甚至内嵌“脚本程序”,从而使网页内容丰富多彩 文档头部, 包含该文档的标题和其它说明信息 文档正文, 包含该信息资源的具体内容(文字与图片)
网页中的超链(hyperlink) 超链提供了将网页相互链接起来、并从一个网页方便地访问其它网页的手段 超链是一种有向链,包括链源(引用处)和链宿(被引用对象): 链源(也称为锚或锚点)可以是网页中的文字或图片 链宿可以是: 同一个或另一个网站中的网页(用URL指出) 本网页内的某段文字或某个图片(用书签指出) 当鼠标指针指向网页中的链源时,指针会由箭头改变为手指状,单击左键,浏览器将立即转去访问该超链所链接的网页 超 链 如何在网页上识别超链的链源? 1 文字具有不同的颜色并有下划线; 2 鼠标指针改变为手指状
网页的地址——URL 例:某课程网站主页的URL为: 统一资源定位器URL (Uniform Resource Locator)用来标识WWW网中每个信息资源(网页)的地址 URL由3部分组成,表示形式为: 协议名称 : //主机域名或IP地址 [:端口号 ] /文件路径 /文件名 例:某课程网站主页的URL为: http://graphics.nju.edu.cn/coursebin/index.php http表示向Web服务器请求将某个网页传输给用户的浏览器 主机域名指提供此服务的计算机的域名(端口号通常是默认的,如Web服务器是80,一般不需给出) /文件路径/文件名指的是网页在Web服务器硬盘中的路径和文件名,缺省时以index.html或default.html作为默认的文件名) (注:http = 超文本传输协议(Hyper Text Transport Protocol))
选讲: 超文本传输协议HTTP HTTP是一种应用层协议,它提供了在客户机与Web服务器之间相互对话和传输信息的一种机制——请求报和响应报 HTTP协议规定了“请求报文”和“响应报文”的格式: 请求报文中通常含有网页的地址URL 响应报文中通常含有客户机所请求的网页 URL 下传的网页
Web浏览器(Browser)软件 浏览器软件的用户界面 浏览器是运行在客户计算机上的一种软件,它是观察Web的窗口,它必须能: 1 执行HTTP协议,向Web服务器请求网页 2 接收Web服务器下载的网页 3 解释网页(HTML文档)的内容,并在窗口中展示 4 提供用户界面,进行人机交互
(graphics.nju.edu.cn 服务器) 浏览器访问网页的工作过程 1 用户在浏览器地址栏中输入网页的URL(或点击某个超链) 3 Web服务器在硬盘中找出网页,将网页放在响应报文中回传给浏览器 2 浏览器发出HTTP请求报文,将网页的URL发送给Web服务器 http://graphics.nju.edu.cn/ WWW服务器 http://cs.nju.edu.cn/xsyd/ LAN 或WAN (客户机) 浏览器 软件 请求网页 (cs.nju.edu.cn服务器) WWW服务器 浏览器任务:建立连接、发出网页请求、接收服务器送来的网页、对网页进行解释并显示网页内容 Web服务器不断重复执行如下任务:等待浏览器请求,建立连接,读出并下传网页,关闭连接 4 浏览器程序将网页内容显示给用户 (graphics.nju.edu.cn 服务器)
例:从浏览器上看到的网页 网页地址(URL) 网页的标题 网页内容 超 级链接 网页中的图片
网页下载和处理的过程 网页下载的过程是: 网页中的声音和视频部分可以有2种下载方式: 先下载和显示网页的文字部分,再下载网页中的图片和声音部分, 以及其它的脚本程序(script)等 下载网页的所有部分均存放在浏览器的缓冲存储器之中,以便再次访问该网页时使用 网页中的声音和视频部分可以有2种下载方式: 普通方式(等待全部下载完毕之后再进行播放) 流媒体方式(Streaming media,边下载边播放) 网页中包含的某些非HTML成分,浏览器本身无法直接播放,必须: 调用本机已安装的Word, Acrobat, PowerPoint等程序进行展示 或者下载特定的plug-in(插入式应用程序,如Shockwave,Real Audio等)进行展示或播放
IE浏览器的其它功能 使用IE浏览器除了查找、浏览和下载网页之外,它还能完成几乎所有传统的因特网服务,如: 电子邮件 (mailto:// 执行SMTP协议,向远程计算机发送电子邮件) (https:// 执行邮件协议,向远程计算机收发电子邮件) 远程登录 (telnet:// 执行TELNET协议,登录远程计算机) 文件传输(FTP) (ftp:// 执行FTP协议,使FTP服务器与用户的计算机进行远程文件传输操作) 电子公告板服务 (news:// 执行NNTP协议,访问远程计算机提供的新闻)
选讲: Web浏览器的主要组成部分 控制程序 用户输入 服务请求 HTTP 客户程序 FTP E-mail 网 络 接 口 输出展示程序 HTML解释器 MIME解释器 输出展示程序 显 示 器 控制流 数据流 因特网 HTML文档 网页内容 邮件内容 邮件
如何在WWW上寻找信息? 在WWW上寻找信息的途径: 网上冲浪 (在网上漫游) 从出版物中了解 听他人介绍 Search (搜索) 使用主题目录(subject directories) 使用搜索引擎(search engines)
按主题目录寻找信息 一级分类标题 网页(网站)按主题分类排列, 通过一层一层地点击超链来查找有关信息 二级分类标题
使用搜索引擎查找信息 检索得到(命中)371万结果的一部分 Google搜索引擎的初始界面 输入关键字
选讲: 搜索引擎的工作过程与评价 对搜索效果的评价: 用户提出检索请求时,搜索引擎通过检查索引找出匹配的文本(或URL地址),然后返回给用户 选讲: 搜索引擎的工作过程与评价 用户提出检索请求时,搜索引擎通过检查索引找出匹配的文本(或URL地址),然后返回给用户 预先使用软件robot遍历Web,将Web上的信息下载到本地文档库 对文本内容进行自动分析并建立索引 对搜索效果的评价: 精度: 返回结果中相关的网页占返回网页总数的百分比 召回率: 返回结果中相关的网页占Web中全部相关网页的百分比 全部网页 返回网页 所有相关网页
Web信息处理系统
Web应用的发展 Web应用的发展: Web技术的发展: 从信息发布/检索的平台→各种因特网应用的平台(电子商务、电子政务、数字校园等) 静态网页(HTM/HTML) → 动态网页(ASP/JSP/PHP/CGI/ASPX) 二层结构→三层结构
静态网页与动态网页 静态网页 动态网页 内容固定不变,任何时候访问该网页所得到的内容都一样 优点:简单、响应速度快 不足:不适合于网页中包含动态数据(如外汇行情、股票价格、天气情况等)的应用场合 动态网页 网页内容是在网页请求时服务器根据当时实际的数据内容而临时生成的 优点:适合于网页中包含动态数据的应用场合 结构特点: 动态数据一般都存放在web 服务器后台的数据库中,因此服务器端还必须访问数据库,并为客户机生成它所需要的网页 简单的两层B/S架构无法满足动态网页访问的要求
选讲: 访问动态网页的工作过程 LAN 或WAN (客户机) ODBC 数据库 ②发送到Web服务器 选讲: 访问动态网页的工作过程 ②发送到Web服务器 http://www.taobao.com/ (以访问淘宝网为例) Web服务器进程 LAN 或WAN ⑨返回 页面 (客户机) 浏览器 进程 ① Web服务器 请求网页 ⑧生成并将动态数据插入页面,返回给Web服务器 ③转发动态 页面请求 ⑩接受网页, 解释并显示 网页内容 Web应用 服务器进程 ④连接数据库 驱动程序 数据库服务器进程 Web应用服务器 ⑤执行查询操作 ODBC ⑦返回结果到 Web应用服务器 数据库 ⑥返回查询结果到 数据库驱动程序 数据库服务器 41
选讲: 动态Web各组成部分的功能 LAN 或WAN ODBC 数据库 (客户机) 浏览器 Web服务器 ① ⑨ ② ④ ⑤ ⑥ ⑩ ③ ⑦ 数据库服务器进程 数据库服务器 ODBC ① ⑨ ② ④ ⑤ ⑥ ⑩ 数据库 ③ ⑦ ⑧ 客户机浏览器,输入淘宝网网址,发出网页请求 解析HTTP请求,将动态网页(ASP.NET、JSP等)转发给Web应用程序服务器 开放数据库互连,提供数据库访问的应用程序接口API 数据库:存储淘宝网产品数据及客户信息 分析并执行动态页面中的程序,将数据库查询命令发送到数据库驱动程序 数据库管理员:数据库的更新与维护 数据库服务器:执行收到的SQL数据库查询命令 42
动态Web的三层结构 第一层:客户端展现层,Web浏览器 第二层:Web服务器层+Web应用服务器层 客户机 浏览器 网络 Web服务器程序 应用程序 脚本程序 数据库系统 ODBC/JDBC 应用程序接口API 请求 响应 静态 网页 应用 服务器 Web 数据库 第一层:客户端展现层,Web浏览器 第二层:Web服务器层+Web应用服务器层 Web服务器:负责页面请求的受理、页面转发和页面下传 Web应用服务器: 完成应用相关的各种处理 向第3层请求数据访问 生成用户所需的页面 第三层:数据库系统:完成数据的存取和处理
关于数据库系统 数据库 (DB) 数据库管理系统 与应用软件的接口 SQL查询命令 DBMS ODBC 结果数据 数据库管理员:负责数据库的更新与维护 是长期存放数据的“仓库”,其中的数据按一定方式(例如表格形式)组织和存放,能被多个用户和程序快速存取与共享 是控制和管理数据库的大型软件 任务是统一管理和控制数据库的建立和应用,保证数据的安全性、完整性及数据库的可靠性 并发性:允许许多应用程序和用户同时使用数据库 代表产品:ORACLE, DB2, SQL Server、Access、VFP等。
附:上网须知 1)如果不需要上网,请不要上网。连接网络是在浪费网络资源和减慢别人的速度。做完作业之后再上网。登录以前,预先制定出计划,将发送的信息编辑和修改完成。 2)避免高峰期上网。网络拥堵常常是呈波浪形式的。如果上网避开了高峰期,那么就可以节省大量的时间。 3)反复核对网上信息来源。不要认为网上看到的信息都是真实、准确和及时的。 4)小心,再小心。在网上很容易迷失自己和浪费时间 5)避免信息量超载。提到信息,越多不一定越好,要有选择地查询。不要浪费时间和力气来拥有网上成山的信息。信息不是知识,知识不是智慧。不良信息比没有信息更糟糕