计 算 机 网 络 主 讲: 陈 伟 宏 职 称: 副 教 授 湖南城市学院计算机科学系 2011.9
第 6 章 应用层 6.1 域名系统 DNS 6.2 文件传送协议 6.3 远程终端协议 TELNET 6.4 万维网 WWW 第 6 章 应用层 6.1 域名系统 DNS 6.2 文件传送协议 6.3 远程终端协议 TELNET 6.4 万维网 WWW 6.5 电子邮件 6.6 动态主机配置协议 DHCP 6.7 简单网络管理协议 SNMP 6.8 应用进程跨越网络的通信
应用层协议的特点 每个应用层协议都是为了解决某一类应用问题,而问题的解决又往往是通过位于不同主机中的多个应用进程之间的通信和协同工作来完成的。应用层的具体内容就是规定应用进程在通信时所遵循的协议。 应用层的许多协议都是基于客户服务器方式。
6.1 域名系统 DNS 6.1.1 域名系统概述 许多应用层软件经常直接使用域名系统 DNS (Domain Name System),但计算机的用户只是间接而不是直接使用域名系统。 因特网采用层次结构的命名树作为主机的名字,并使用分布式的域名系统 DNS。 名字到 IP 地址的解析是由若干个域名服务器程序完成的。域名服务器程序在专设的结点上运行,运行该程序的机器称为域名服务器。
6.1.2 因特网的域名结构 因特网采用了层次树状结构的命名方法。 6.1.2 因特网的域名结构 因特网采用了层次树状结构的命名方法。 任何一个连接在因特网上的主机或路由器,都有一个唯一的层次结构的名字,即域名。 域名的结构由标号序列组成,各标号之间用点隔开: … . 三级域名 . 二级域名 . 顶级域名 各标号分别代表不同级别的域名,每个标号不超过63个字符,域名总长度不超过255个字符。
顶级域名 TLD (Top Level Domain) (1) 国家顶级域名 nTLD:如: .cn 表示中国,.us 表示美国,.uk 表示英国,等等。 (2) 通用顶级域名 gTLD:最早的顶级域名是: .com (公司和企业) .net (网络服务机构) .org (非赢利性组织) .edu (美国专用的教育机构() .gov (美国专用的政府部门) .mil (美国专用的军事部门) .int (国际组织)
顶级域名 TLD (续) (3) 基础结构域名(infrastructure domain):这种顶级域名只有一个,即 arpa,用于反向域名解析,因此又称为反向域名。
新增加了下列的通用顶级域名 .aero (航空运输企业) .biz (公司和企业) .cat (加泰隆人的语言和文化团体) .coop (合作团体) .info (各种情况) .jobs (人力资源管理者) .mobi (移动产品与服务的用户和提供者) .museum (博物馆) .name (个人) .pro (有证书的专业人员) .travel (旅游业)
… … … … 因特网的域名空间 根 com net org edu gov aero cn uk 顶级域名 bj edu com cctv ibm hp 二级域名 pku tsinghua … 三级域名 mail www 四级域名 mail … www
6.1.3 域名服务器 一个服务器所负责管辖的(或有权限的)范围叫做区(zone)。 6.1.3 域名服务器 一个服务器所负责管辖的(或有权限的)范围叫做区(zone)。 每一个区设置相应的权限域名服务器,用来保存该区中的所有主机的域名到IP地址的映射。 区可能小于或等于域,但一定不可能大于域。
区的不同划分方法举例 根 (b) 区 < 域 域 abc.com 区 abc.com y.abc.com abc x u v w t edu org 根 org com edu 域 abc.com abc 区 abc.com x y u v w t (a) 区 = 域
树状结构的 DNS 域名服务器 … 根域名服务器 根域名服务器 顶级域名服务器 org 域名服务器 com 域名服务器 edu 域名服务器 abc.com 域名服务器 abc 公司有两个 权限域名服务器 权限域名服务器 y.abc.com 域名服务器
域名服务器有以下四种类型 根域名服务器 顶级域名服务器 权限域名服务器 本地域名服务器
根域名服务器 ——最高层次的域名服务器—— 根域名服务器 ——最高层次的域名服务器—— 根域名服务器是最重要的域名服务器。所有的根域名服务器都知道所有的顶级域名服务器的域名和 IP 地址。 不管是哪一个本地域名服务器,若要对因特网上任何一个域名进行解析,只要自己无法解析,就首先求助于根域名服务器。 在因特网上共有13 个不同 IP 地址的根域名服务器,它们的名字是用一个英文字母命名,从a 一直到 m(前13 个字母)。
根域名服务器共有 13 套装置 (不是 13 个机器) 这些根域名服务器相应的域名分别是 a.rootservers.net b.rootservers.net … m.rootservers.net 到 2006 年底全世界已经安装了一百多个根域名服务器机器,分布在世界各地。 这样做的目的是为了方便用户,使世界上大部分 DNS 域名服务器都能就近找到一个根域名服务器。
举例:根域名服务器 f 的地点分布图 共 40 个机器 根域名服务器并不直接把域名直接转换成 IP 地址。 在使用迭代查询时,根域名服务器把下一步应当找 的顶级域名服务器的 IP 地址告诉本地域名服务器。
顶级域名服务器 (即 TLD 服务器) 这些域名服务器负责管理在该顶级域名服务器注册的所有二级域名。 当收到 DNS 查询请求时,就给出相应的回答(可能是最后的结果,也可能是下一步应当找的域名服务器的 IP 地址)。
权限域名服务器 这就是前面已经讲过的负责一个区的域名服务器。 当一个权限域名服务器还不能给出最后的查询回答时,就会告诉发出查询请求的 DNS 客户,下一步应当找哪一个权限域名服务器。
本地域名服务器 本地域名服务器对域名系统非常重要。 当一个主机发出 DNS 查询请求时,这个查询请求报文就发送给本地域名服务器。 每一个因特网服务提供者 ISP,或一个大学,甚至一个大学里的系,都可以拥有一个本地域名服务器, 这种域名服务器有时也称为默认域名服务器。
提高域名服务器的可靠性 DNS 域名服务器都把数据复制到几个域名服务器来保存,其中的一个是主域名服务器,其他的是辅助域名服务器。 主域名服务器定期把数据复制到辅助域名服务器中,而更改数据只能在主域名服务器中进行。这样就保证了数据的一致性。
域名的解析过程 主机向本地域名服务器的查询一般都是采用递归查询。 本地域名服务器向根域名服务器的查询通常是采用迭代查询。 如果主机所询问的本地域名服务器不知道被查询域名的 IP 地址,那么本地域名服务器就以 DNS 客户的身份,向其他根域名服务器继续发出查询请求报文。 当根域名服务器收到本地域名服务器的迭代查询请求报文时,要么给出所要查询的 IP 地址,要么告诉本地域名服务器:“你下一步应当向哪一个域名服务器进行查询”。然后让本地域名服务器进行后续的查询。
本地域名服务器采用迭代查询 迭代查询 根域名服务器 顶级域名服务器 dns.com 本地域名服务器 dns.xyz.com 权限域名服务dns.abc.com y.abc.com 的 IP 地址 递归 查询 需要查找 y.abc.com 的 IP 地址 m.xyz.com
本地域名服务器采用递归查询 (比较少用) 递归查询 根域名服务器 顶级域名服务器 dns.com dns.xyz.com 权限域名服务dns.abc.com y.abc.com 的 IP 地址 递归 查询 需要查找 y.abc.com 的 IP 地址 m.xyz.com
名字的高速缓存 每个域名服务器都维护一个高速缓存,存放最近用过的名字以及从何处获得名字映射信息的记录。 可大大减轻根域名服务器的负荷,使因特网上的 DNS 查询请求和回答报文的数量大为减少。
6.2 文件传送协议 6.2.1 FTP概述 文件传送协议 FTP (File Transfer Protocol) 是因特网上使用得最广泛的文件传送协议。 FTP 提供交互式的访问,允许客户指明文件的类型与格式,并允许文件具有存取权限。 FTP 屏蔽了各计算机系统的细节,因而适合于在异构网络中任意计算机之间传送文件。
6.2.2 FTP 的基本工作原理 文件传送协议 FTP 只提供文件传送的一些基本的服务,它使用 TCP 可靠的运输服务。 FTP 使用客户服务器方式。一个 FTP 服务器进程可同时为多个客户进程提供服务。FTP 的服务器进程由两大部分组成:一个主进程,负责接受新的请求;另外有若干个从属进程,负责处理单个请求。
主进程的工作步骤如下 打开熟知端口(端口号为 21),使客户进程能够连接上。 等待客户进程发出连接请求。 启动从属进程来处理客户进程发来的请求。从属进程对客户进程的请求处理完毕后即终止,但从属进程在运行期间根据需要还可能创建其他一些子进程。 回到等待状态,继续接受其他客户进程发来的请求。主进程与从属进程的处理是并发地进行。
两个连接 控制连接:在整个会话期间一直保持打开,FTP 客户发出的传送请求通过控制连接发送给服务器端的控制进程,但控制连接不用来传送文件。
FTP 使用的两个 TCP 连接 因特网 TCP 控制连接 FTP 客户端 FTP 服务器端 TCP 数据连接 用户界面 控制进程 控制进程 数据传送 进程 数据传送 进程 FTP 客户端 FTP 服务器端 TCP 数据连接
两个不同的端口号 当客户进程向服务器进程发出建立连接请求时,要寻找连接服务器进程的熟知端口(21),同时还要告诉服务器进程自己的另一个端口号码,用于建立数据传送连接。 接着,服务器进程用自己传送数据的熟知端口(20)与客户进程所提供的端口号码建立数据传送连接。 由于 FTP 使用了两个不同的端口号,所以数据连接与控制连接不会发生混乱。
6.3 按远程终端协议 TELNET TELNET 是一个简单的远程终端协议,也是因特网的正式标准。 用户用 TELNET 就可在其所在地通过 TCP 连接注册(即登录)到远地的另一个主机上(使用主机名或 IP 地址)。
客户服务器方式 现在由于 PC 机的功能越来越强,用户已较少使用 TELNET 了。 TELNET 也使用客户服务器方式。在本地系统运行 TELNET 客户进程,而在远地主机则运行 TELNET 服务器进程。 和 FTP 的情况相似,服务器中的主进程等待新的请求,并产生从属进程来处理每一个连接。
TELNET 使用 网络虚拟终端 NVT 格式 因特网 服务器端 客户端 TCP 连接 使用客户端的格式 使用 NVT 格式 使用服务器端的格式
网络虚拟终端 NVT 格式 客户软件把用户的击键和命令转换成 NVT 格式,并送交服务器。
6.4 万维网 WWW 6.4.1 万维网概述 万维网 WWW (World Wide Web) 是一个大规模的、联机式的信息储藏所。 万维网用链接的方法能非常方便地从因特网上的一个站点访问另一个站点,从而主动地按需获取丰富的信息。
万维网提供分布式服务 链接到 链接到 链接到 链接到 链接到 链接到 万维网 站点 A 万维网站点 B 万维网 站点 C 万维网站点 D 万维网站点 E
浏览器的发展 1993年,Mosaic 第一个浏览器 1994年,Netscape 1995年, IE浏览器(InternetExplorer) 1996年, Opera浏览器
超媒体与超文本 万维网是分布式超媒体(hypermedia)系统,它是超文本(hypertext)系统的扩充。 一个超文本由多个信息源链接成。 超媒体与超文本的区别是文档内容不同。超文本文档仅包含文本信息,而超媒体文档还包含其他表示方式的信息,如图形、图像、声音、动画,甚至活动视频图像。
万维网的工作方式 万维网以客户服务器方式工作。 浏览器就是在用户计算机上的万维网客户程序。万维网文档所驻留的计算机则运行服务器程序,因此这个计算机也称为万维网服务器。 客户程序向服务器程序发出请求,服务器程序向客户程序送回客户所要的万维网文档。 在一个客户程序主窗口上显示出的万维网文档称为页面(page)。
万维网必须解决的问题 (1) 怎样标志分布在整个因特网上的万维网文档? (2) 用何协议实现万维网上各种超链的链接? (3) 怎样使各种万维网文档都能在因特网上的各种计算机上显示出来,同时使用户清楚地知道在什么地方存在着超链? (4) 怎样使用户能够很方便地找到所需的信息? 统一资源定位符 URL 超文本传送协议 HTTP 超文本标记语言 HTML 搜索引擎
<协议>://<主机>:<端口>/<路径> 6.4.2 统一资源定位符 URL 1. URL的格式 由以冒号隔开的两大部分组成,并且在 URL 中的字符对大写或小写没有要求。 URL 的一般形式是: <协议>://<主机>:<端口>/<路径> ftp —— 文件传送协议 FTP http —— 超文本传送协议 HTTP News —— USENET 新闻
<协议>://<主机>:<端口>/<路径> URL 的一般形式(续) 由以冒号隔开的两大部分组成,并且在 URL 中的字符对大写或小写没有要求。 URL 的一般形式是: <协议>://<主机>:<端口>/<路径> <主机> 是存放资源的主机 在因特网中的域名
<协议>://<主机>:<端口>/<路径> URL 的一般形式(续) 由以冒号隔开的两大部分组成,并且在 URL 中的字符对大写或小写没有要求。 URL 的一般形式是: <协议>://<主机>:<端口>/<路径> 有时可省略
使用 HTTP 的 URL http://<主机>:<端口>/<路径>
使用 HTTP 的 URL http://<主机>:<端口>/<路径> 冒号和两个斜线是规定的格式
使用 HTTP 的 URL http://<主机>:<端口>/<路径> 这里写主机的域名
使用 HTTP 的 URL http://<主机>:<端口>/<路径>
使用 HTTP 的 URL http://<主机>:<端口>/<路径> 若再省略文件的<路径>项,则 URL 就指到因特网上的某个主页(home page)。
6.4.3 超文本传送协议 HTTP 1. HTTP 的操作过程 从层次的角度看,HTTP 是面向事务的(transaction-oriented)应用层协议,它是万维网上能够可靠地交换文件(包括文本、声音、图像等各种多媒体文件)的重要基础。
万维网的工作过程 请求文档 响应文档 服务器 www.tsinghua.edu.cn 链接到URL的超链 客户 浏览器 程序 清华大学 院系设置 浏览器 程序 服务器 程序 HTTP HTTP 使用此 TCP 连接 因特网 建立 TCP 连接 HTTP 请求报文 请求文档 HTTP 响应报文 响应文档 释放 TCP 连接
用户点击鼠标后所发生的事件 (1) 浏览器分析超链指向页面的 URL。 (2) 浏览器向 DNS 请求解析 www.tsinghua.edu.cn 的 IP 地址。 (3) 域名系统 DNS 解析出清华大学服务器的 IP 地址。 (4) 浏览器与服务器建立 TCP 连接 (5) 浏览器发出取文件命令: GET /chn/yxsz/index.htm。 (6) 服务器给出响应,把文件 index.htm 发给浏览器。 (7) TCP 连接释放。 (8) 浏览器显示“清华大学院系设置”文件 index.htm 中的所有文本。
HTTP 的主要特点 HTTP 是面向事务的客户服务器协议。 HTTP 1.0 协议是无状态的(stateless)。
请求一个万维网文档所需的时间 万维网服务器 万维网客户 发起 TCP 连接 RTT HTTP 请求报文 RTT HTTP 响应报文 传输文档的时间 整个文档收到 时间 时间
持续连接 (persistent connection) HTTP/1.1 协议使用持续连接。 万维网服务器在发送响应后仍然在一段时间内保持这条连接,使同一个客户(浏览器)和该服务器可以继续在这条连接上传送后续的 HTTP 请求报文和响应报文。 目前一些流行的浏览器(例如,IE 6.0)的默认设置就是使用 HTTP 1.1。
代理服务器 (proxy server) 代理服务器(proxy server)又称为万维网高速缓存(Web cache),它代表浏览器发出 HTTP 请求。 万维网高速缓存把最近的一些请求和响应暂存在本地磁盘中。 当与暂时存放的请求相同的新请求到达时,万维网高速缓存就把暂存的响应发送出去,而不需要按 URL 的地址再去因特网访问该资源。
使用高速缓存可减少 访问因特网服务器的时延 没有使用高速缓存的情况 源点服务器 这条链路上 的时延很大 校园网 浏览器 R1 R2 2 Mb/s 因特网 所有万维网通信量 都经过这条链路
使用高速缓存的情况 (1) 浏览器访问因特网的服务器时,要先与校园网的高速缓存建立 TCP 连接,并向高速缓存发出 HTTP 请求报文 源点服务器 校园网 浏览器 R1 R2 2 Mb/s 因特网 校园网的高速缓存 (代理服务器)
使用高速缓存的情况 (2) 若高速缓存已经存放了所请求的对象,则将此对象放入 HTTP 响应报文中返回给浏览器。 源点服务器 校园网 浏览器 R1 R2 2 Mb/s 因特网 校园网的高速缓存 (代理服务器)
使用高速缓存的情况 (3) 否则,高速缓存就代表发出请求的用户浏览器,与因特网上的源点服务器建立 TCP 连接,并发送 HTTP 请求报文。 校园网 浏览器 R1 R2 2 Mb/s 因特网 校园网的高速缓存 (代理服务器)
使用高速缓存的情况 (4) 源点服务器将所请求的对象放在 HTTP 响应报文中返回给校园网的高速缓存。 源点服务器 校园网 浏览器 R1 2 Mb/s 因特网 校园网的高速缓存 (代理服务器)
使用高速缓存的情况 (5) 高速缓存收到此对象后,先复制在其本地存储器中(为今后使用),然后再将该对象放在 HTTP 响应报文中,通过已建立的 TCP 连接,返回给请求该对象的浏览器。 源点服务器 校园网 浏览器 R1 R2 2 Mb/s 因特网 校园网的高速缓存 (代理服务器)
3. HTTP 的报文结构 HTTP 有两类报文: 请求报文——从客户向服务器发送请求报文。 响应报文——从服务器到客户的回答。 由于 HTTP 是面向正文的(text-oriented),因此在报文中的每一个字段都是一些 ASCII 码串,因而每个字段的长度都是不确定的。
HTTP 的报文结构(请求报文) 开始行 报文由三个部分组成,即开始行、首部行和实体主体。 在请求报文中,开始行就是请求行。 空格 回车换行 方 法 URL 版 本 CRLF 请求行 首部字段名 : 值 CRLF … 首部行 首部字段名 : 值 CRLF CRLF : 实体主体 (通常不用) 报文由三个部分组成,即开始行、首部行和实体主体。 在请求报文中,开始行就是请求行。
HTTP 的报文结构(响应报文) 开始行 响应报文的开始行是状态行。 空格 回车换行 开始行 版 本 状态码 短 语 CRLF 状态行 首部字段名 : 值 CRLF … 首部行 首部字段名 : 值 CRLF CRLF : 实体主体 (有些响应报文不用) 响应报文的开始行是状态行。 状态行包括三项内容,即 HTTP 的版本,状态码,以及解释状态码的简单短语。
6.4.4 万维网的文档 1. 超文本标记语言 HTML 超文本标记语言 HTML 中的 Markup 的意思就是“设置标记”。 HTML 把各种标签嵌入到万维网的页面中。这样就构成了所谓的 HTML 文档。HTML 文档是一种可以用任何文本编辑器创建的 ASCII 码文件。
HTML 文档 仅当 HTML 文档是以.html 或 .htm 为后缀时,浏览器才对此 文档的各种标签进行解释。
HTML 文档中标签的用法 HTML 文档开始 <HTML> <HEAD> <TITLE>一个 HTML 的例子</TITLE> </HEAD> <BODY> <H1>HTML 很容易掌握</H1> <P>这是第一个段落。虽然很 短,但它仍是一个段落。</P> <P>这是第二个段落。</P> </BODY> </HTML> HTML 文档开始
HTML 文档中标签的用法 <HTML> <HEAD> <TITLE>一个 HTML 的例子</TITLE> </HEAD> <BODY> <H1>HTML 很容易掌握</H1> <P>这是第一个段落。虽然很 短,但它仍是一个段落。</P> <P>这是第二个段落。</P> </BODY> </HTML> 首部开始
HTML 文档中标签的用法 <HTML> 标题 <HEAD> <TITLE>一个 HTML 的例子</TITLE> </HEAD> <BODY> <H1>HTML 很容易掌握</H1> <P>这是第一个段落。虽然很 短,但它仍是一个段落。</P> <P>这是第二个段落。</P> </BODY> </HTML> 标题
HTML 文档中标签的用法 <HTML> <HEAD> <TITLE>一个 HTML 的例子</TITLE> </HEAD> <BODY> <H1>HTML 很容易掌握</H1> <P>这是第一个段落。虽然很 短,但它仍是一个段落。</P> <P>这是第二个段落。</P> </BODY> </HTML> 首部结束
HTML 文档中标签的用法 <HTML> <HEAD> <TITLE>一个 HTML 的例子</TITLE> </HEAD> <BODY> <H1>HTML 很容易掌握</H1> <P>这是第一个段落。虽然很 短,但它仍是一个段落。</P> <P>这是第二个段落。</P> </BODY> </HTML> 主体开始
HTML 文档中标签的用法 <HTML> <HEAD> <TITLE>一个 HTML 的例子</TITLE> </HEAD> <BODY> <H1>HTML 很容易掌握</H1> <P>这是第一个段落。虽然很 短,但它仍是一个段落。</P> <P>这是第二个段落。</P> </BODY> </HTML> 1 级标题
HTML 文档中标签的用法 <HTML> <HEAD> <TITLE>一个 HTML 的例子</TITLE> </HEAD> <BODY> <H1>HTML 很容易掌握</H1> <P>这是第一个段落。虽然很 短,但它仍是一个段落。</P> <P>这是第二个段落。</P> </BODY> </HTML> 第一个段落
HTML 文档中标签的用法 <HTML> <HEAD> <TITLE>一个 HTML 的例子</TITLE> </HEAD> <BODY> <H1>HTML 很容易掌握</H1> <P>这是第一个段落。虽然很 短,但它仍是一个段落。</P> <P>这是第二个段落。</P> </BODY> </HTML> 第二个段落
HTML 文档中标签的用法 <HTML> <HEAD> <TITLE>一个 HTML 的例子</TITLE> </HEAD> <BODY> <H1>HTML 很容易掌握</H1> <P>这是第一个段落。虽然很 短,但它仍是一个段落。</P> <P>这是第二个段落。</P> </BODY> </HTML> 主体结束
HTML 文档中标签的用法 <HTML> <HEAD> <TITLE>一个 HTML 的例子</TITLE> </HEAD> <BODY> <H1>HTML 很容易掌握</H1> <P>这是第一个段落。虽然很 短,但它仍是一个段落。</P> <P>这是第二个段落。</P> </BODY> </HTML> HTML 文档结束
两种不同的链接 远程链接:超链的终点是其他网点上的页面。 本地链接:超链指向本计算机中的某个文件。
2. 动态万维网文档 静态文档是指该文档创作完毕后就存放在万维网服务器中,在被用户浏览的过程中,内容不会改变。 2. 动态万维网文档 静态文档是指该文档创作完毕后就存放在万维网服务器中,在被用户浏览的过程中,内容不会改变。 动态文档是指文档的内容是在浏览器访问万维网服务器时才由应用程序动态创建。 动态文档和静态文档之间的主要差别体现在服务器一端。这主要是文档内容的生成方法不同。而从浏览器的角度看,这两种文档并没有区别。
万维网服务器功能的扩充 (1) 应增加另一个应用程序,用来处理浏览器发来的数据,并创建动态文档。 (2) 应增加一个机制,用来使万维网服务器把浏览器发来的数据传送给这个应用程序,然后万维网服务器能够解释这个应用程序的输出,并向浏览器返回 HTML 文档。
扩充了功能的万维网服务器 CGI 程序创建 请求文档 响应动态文档 万维网服务器 万维网客户 浏览器 数据库 程序 HTTP CGI 程序创建 动态文档 HTTP 请求报文 请求文档 响应动态文档 HTTP 响应报文
通用网关接口 CGI (Common Gateway Interface) 万维网服务器与 CGI 的通信遵循 CGI 标准。 “通用”:CGI 标准所定义的规则对其他任何语言都是通用的。 “网关”:CGI 程序的作用像网关。 “接口”:有一些已定义好的变量和调用等可供其他 CGI 程序使用。
CGI 程序 CGI 程序的正式名字是 CGI 脚本(script)。 “脚本”指的是一个程序,它被另一个程序(解释程序)而不是计算机的处理机来解释或执行。 脚本运行起来要比一般的编译程序要慢,因为它的每一条指令先要被另一个程序来处理(这就要一些附加的指令),而不是直接被指令处理器来处理。
3. 活动万维网文档 活动文档(active document)技术把所有的工作都转移给浏览器端。 3. 活动万维网文档 活动文档(active document)技术把所有的工作都转移给浏览器端。 每当浏览器请求一个活动文档时,服务器就返回一段程序副本在浏览器端运行。 活动文档程序可与用户直接交互,并可连续地改变屏幕的显示。 由于活动文档技术不需要服务器的连续更新传送,对网络带宽的要求也不会太高。
活动文档在客户端创建 请求文档 响应程序 此程序在 万维网服务器 万维网客户 浏览器 程序 服务器 程序 程序 HTTP 程序事先被编译成二进制代码,存放为文件 HTTP 请求报文 请求文档 响应程序 HTTP 响应报文 程序 此程序在 客户端创建 出活动文档 文档
4. 浏览器的结构 必不可少 核心 从鼠标和键盘输入 输出至显示器 HTML解释程序 驱 动 程 序 控 制 程 序 … 可选解释程序 4. 浏览器的结构 必不可少 从鼠标和键盘输入 输出至显示器 HTML解释程序 驱 动 程 序 控 制 程 序 … 核心 可选解释程序 缓 存 HTTP 客户程序 … 可选客户程序 网 络 接 口 与远地 服务器通信
6.4.5 万维网的信息检索系统 1. 全文检索搜索和分类目录搜索 6.4.5 万维网的信息检索系统 1. 全文检索搜索和分类目录搜索 在万维网中用来进行搜索的程序叫做搜索引擎。 工作原理:通过搜索软件到因特网上的各网站收集信息,找到一个网站后可以从这个网站再链接到另一个网站。然后按照一定的规则建立一个很大的在线数据库供用户查询。 用户在查询时只要输入关键词,就从已经建立的索引数据库上进行查询。
分类目录搜索 分类目录搜索引擎并不采集网站的任何信息,而是利用各网站向搜索引擎提交的网站信息时填写的关键词和网站描述等信息,经过人工审核编辑后,如果认为符合网站登录的条件,则输入到分类目录的数据库中,供网上用户查询。 分类目录搜索也叫做分类网站搜索。
一些著名的搜索引擎 最著名的全文检索搜索引擎: 最著名的分类目录搜索引擎: Google(谷歌)(www.google.com) 百度 (www.baidu.com) 最著名的分类目录搜索引擎: 雅虎 (www.yahoo.com) 雅虎中国 (cn.yahoo.com) 新浪 (www.sina.com) 搜狐 (www.sohu.com) 网易 (www.163.com)
垂直搜索引擎 (Vertical Search Engine) 针对某一特定领域、特定人群或某一特定需求提供搜索服务。垂直搜索也是提供关键字来进行搜索的,但被放到了一个行业知识的上下文中,返回的结果更倾向于信息、消息、条目等。
6.5 电子邮件 6.5.1 概述 电子邮件(e-mail)是因特网上使用得最多的和最受用户欢迎的一种应用。 6.5 电子邮件 6.5.1 概述 电子邮件(e-mail)是因特网上使用得最多的和最受用户欢迎的一种应用。 电子邮件把邮件发送到收件人使用的邮件服务器,并放在其中的收件人邮箱中,收件人可随时上网到自己使用的邮件服务器进行读取。 电子邮件不仅使用方便,而且还具有传递迅速和费用低廉的优点。 现在电子邮件不仅可传送文字信息,而且还可附上声音和图像。
电子邮件的一些标准 发送邮件的协议:SMTP 读取邮件的协议:POP3 和 IMAP MIME 在其邮件首部中说明了邮件的数据类型(如文本、声音、图像、视像等),使用 MIME 可在邮件中同时传送多种类型的数据。
电子邮件的最主要的组成构件 (发送邮件) 用户邮箱 SMTP (读取邮件) 接收方 发送方 (发送邮件) POP3 SMTP 因特网 发件人 用户代理 发送方 邮件服务器 接收方 邮件服务器 收件人 用户代理 读取 邮件 发送 邮件 SMTP 客户 SMTP SMTP 服务器 POP3 服务器 POP3 POP3 客户 TCP 连接 TCP 连接 SMTP 客户 发送邮件 SMTP SMTP 服务器 TCP 连接 (发送邮件) 用户邮箱 SMTP (读取邮件) 接收方 发送方 (发送邮件) POP3 SMTP 因特网 用户代理 用户代理 邮件缓存 发送端 邮件服务器 接收端 邮件服务器
用户代理 UA (User Agent) 用户代理 UA 就是用户与电子邮件系统的接口,是电子邮件客户端软件。 用户代理的功能:撰写、显示、处理和通信。 邮件服务器的功能是发送和接收邮件,同时还要向发信人报告邮件传送的情况(已交付、被拒绝、丢失等)。 邮件服务器按照客户服务器方式工作。邮件服务器需要使用发送和读取两个不同的协议。
应当注意 一个邮件服务器既可以作为客户,也可以作为服务器。 例如,当邮件服务器 A 向另一个邮件服务器 B 发送邮件时,邮件服务器 A 就作为 SMTP 客户,而 B 是 SMTP 服务器。 当邮件服务器 A 从另一个邮件服务器 B 接收邮件时,邮件服务器 A 就作为 SMTP 服务器,而 B 是 SMTP 客户。
发送和接收电子邮件的 几个重要步骤 发件人调用 PC 机中的用户代理撰写和编辑要发送的邮件。 发件人的用户代理把邮件用 SMTP 协议发给发送方邮件服务器, SMTP 服务器把邮件临时存放在邮件缓存队列中,等待发送。 发送方邮件服务器的 SMTP 客户与接收方邮件服务器的 SMTP 服务器建立 TCP 连接,然后就把邮件缓存队列中的邮件依次发送出去。
发送和接收电子邮件的 几个重要步骤(续) 运行在接收方邮件服务器中的SMTP服务器进 程收到邮件后,把邮件放入收件人的用户邮箱中,等待收件人进行读取。 收件人在打算收信时,就运行 PC 机中的用户代理,使用 POP3(或 IMAP)协议读取发送给自己的邮件。 请注意,POP3 服务器和 POP3 客户之间的通信是由 POP3 客户发起的。
电子邮件的组成 电子邮件由信封(envelope)和内容(content)两部分组成。 电子邮件的传输程序根据邮件信封上的信息来传送邮件。用户在从自己的邮箱中读取邮件时才能见到邮件的内容。 在邮件的信封上,最重要的就是收件人的地址。
电子邮件地址的格式 TCP/IP 体系的电子邮件系统规定电子邮件地址的格式如下: 收件人邮箱名@邮箱所在主机的域名 (6-1) 收件人邮箱名@邮箱所在主机的域名 (6-1) 符号“@”读作“at”,表示“在”的意思。 例如,电子邮件地址 xiexiren@tsinghua.org.cn 这个用户名在该域名 的范围内是唯一的。 邮箱所在的主机的域名 在全世界必须是唯一的
6.5.2 简单邮件传送协议 SMTP SMTP 所规定的就是在两个相互通信的 SMTP 进程之间应如何交换信息。 连接释放:邮件发送完毕后,SMTP 应释放 TCP 连接。
6.5.3 电子邮件的信息格式 一个电子邮件分为信封和内容两大部分。 6.5.3 电子邮件的信息格式 一个电子邮件分为信封和内容两大部分。 RFC 822 只规定了邮件内容中的首部(header)格式,而对邮件的主体(body)部分则让用户自由撰写。 用户写好首部后,邮件系统将自动地将信封所需的信息提取出来并写在信封上。所以用户不需要填写电子邮件信封上的信息。 邮件内容首部包括一些关键字,后面加上冒号。最重要的关键字是:To 和 Subject。
6.5.4 邮件读取协议 POP3 和 IMAP 邮局协议 POP 是一个非常简单、但功能有限的邮件读取协议,现在使用的是它的第三个版本 POP3。 POP 也使用客户服务器的工作方式。 在接收邮件的用户 PC 机中必须运行 POP 客户程序,而在用户所连接的 ISP 的邮件服务器中则运行 POP 服务器程序。
IMAP 协议 (Internet Message Access Protocol) IMAP 也是按客户服务器方式工作,现在较新的是版本 4,即 IMAP4。 用户在自己的 PC 机上就可以操纵 ISP 的邮件服务器的邮箱,就像在本地操纵一样。 因此 IMAP 是一个联机协议。当用户 PC 机上的 IMAP 客户程序打开 IMAP 服务器的邮箱时,用户就可看到邮件的首部。若用户需要打开某个邮件,则该邮件才传到用户的计算机上。
必须注意 不要将邮件读取协议 POP 或 IMAP 与邮件传送协议 SMTP 弄混。
6.5.5 基于万维网的电子邮件 20世纪90年代中,Hotmail引入了基于万维网的电子邮件。 6.5.5 基于万维网的电子邮件 20世纪90年代中,Hotmail引入了基于万维网的电子邮件。 E-mail从 A 发送到邮件服务器是使用 HTTP 协议。 两个邮件服务器之间的传送使用 SMTP。 邮件从邮件服务器传送到 B 是使用 HTTP 协议。 网易邮件服务器 mail.163.com 新浪邮件服务器 mail.sina.com.cn A B HTTP SMTP HTTP
6.5.6 通用因特网邮件扩充 MIME 1. MIME 概述 SMTP 有以下缺点: SMTP 不能传送可执行文件或其他的二进制对象。 SMTP 限于传送 7 位的 ASCII 码。许多其他非英语国家的文字(如中文、俄文,甚至带重音符号的法文或德文)就无法传送。 SMTP 服务器会拒绝超过一定长度的邮件。 某些 SMTP 的实现并没有完全按照[RFC 821]的 SMTP 标准。
MIME 的特点 MIME 并没有改动 SMTP 或取代它。 MIME 的意图是继续使用目前的[RFC 822]格式,但增加了邮件主体的结构,并定义了传送非 ASCII 码的编码规则。
MIME 和 SMTP 的关系 用户 用户 对于任意的二进制文件,可用 base64 编码。 非 ASCII 码 非 ASCII 码
MIME 主要包括三个部分 5 个新的邮件首部字段,它们可包含在[RFC 822]首部中。这些字段提供了有关邮件主体的信息。 定义了许多邮件内容的格式,对多媒体电子邮件的表示方法进行了标准化。 定义了传送编码,可对任何内容格式进行转换,而不会被邮件系统改变。
MIME 增加 5 个 新的邮件首部 MIME-Version: 标志 MIME 的版本。现在的版本号是 1.0。若无此行,则为英文文本。 Content-Description: 这是可读字符串,说明此邮件是什么。和邮件的主题差不多。 Content-Id: 邮件的唯一标识符。 Content-Transfer-Encoding: 在传送时邮件的主体是如何编码的。 Content-Type: 说明邮件的性质。