第八章多媒体技术基础.

第八章多媒体技术基础

第八章多媒体技术基础 8.1 多媒体技术概述 8.2 多媒体计算机系统的组成 8.3 多媒体技术 8.4 多媒体技术的应用领域
第八章多媒体技术基础 8.1 多媒体技术概述 8.2 多媒体计算机系统的组成 8.3 多媒体技术 8.4 多媒体技术的应用领域第八章多媒体技术基础

8.1 多媒体技术概述多媒体技术的概念多媒体技术的特点多媒体技术中的媒体元素第八章多媒体技术基础

多媒体技术的概念在计算机领域，媒体有两种含义：一是指存储信息的实体，例如磁盘、磁带、光盘、半导体存储器等；二是指传递信息的载体，例如声音、图像、图形、文字等。多媒体技术中的“媒体”是指后者，是一种能够表达信息的形式。国际电话电报咨询委员会CCITT把媒体分成了以下五类，即感觉媒体、表示媒体、表现媒体、存储媒体和传输媒体。第八章多媒体技术基础

（4）存储媒体（Storage Medium）：指用于存储表示媒体的物理介质。如硬盘、软盘、磁盘、光盘、ROM及RAM等。
（1）感觉媒体（Perception Medium）：指直接作用于人的感觉器官，使人产生直接感觉的媒体。如引起听觉反应的声音，引起视觉反应的图像等。（2）表示媒体（Representation Medium）：指传输感觉媒体的中介媒体，即用于数据交换的编码。如图像编码、文本编码和声音编码等。这是为了加工、处理和传输感觉媒体而人为地研究、构造出来的一类媒体。（ 3）表现媒体（Presentation Medium）：指进行信息输入和输出的媒体。如键盘、鼠标、扫描仪、话筒、摄像机等为输入媒体；显示器、打印机、喇叭等为输出媒体。（4）存储媒体（Storage Medium）：指用于存储表示媒体的物理介质。如硬盘、软盘、磁盘、光盘、ROM及RAM等。第八章多媒体技术基础

（5）传输媒体（Transmission Medium）：指传输表示媒体的物理介质。如双绞线、同轴电缆和光缆等。
多媒体（Multimedia）从字面上理解就是两种及两种以上媒体的集成。多媒体技术是对多种媒体进行综合处理的技术。确切地说，多媒体技术是把数字、文字、声音、图形、图像和动画等各种媒体有机组合起来，利用计算机、通信和广播电视技术，使它们建立起逻辑联系，并能进行加工处理的技术。第八章多媒体技术基础

多媒体技术的特点多媒体具有多样性、集成性、交互性和实时性的特点。 1. 多媒体信息的多样性信息载体的多样性是多媒体的主要特性之一，也是多媒体研究需要解决的关键问题。信息载体的多样化是相对计算机而言的，在多媒体技术中，计算机所处理的信息空间范围拓展了，不再局限于数值、文本、图形和特殊对待的图像，并且强调计算机与声音、活动图像（或称为影像）相结合，以满足人的感官对多媒体信息的需求，这在计算机辅助教育以及产品广告、动画片制作等方面有很大的发展前途。第八章多媒体技术基础

2. 多媒体技术的集成性多媒体技术不仅要对多种形式的信息进行各种处理，而且要将它们有机地结合起来。突出的例子是动画制作，要将计算机产生的图形或动画与摄像机摄得的图像叠加在一起，在播放时再和文字、声音混合，这样，就需要对多种信息进行综合和集成处理。多媒体的集成性主要体现在两个方面：一是多媒体信息的集成，是指各种媒体信息应能按照一定的数据模型和组织结构集成为一个有机的整体，以便媒体的充分共享和操作使用；二是操作这些媒体信息的工具和设备的集成，是指与多媒体相关的各种硬件设备的集成和软件的集成，为多媒体系统的开发和实现建立一个理想的集成环境，以提高多媒体的生产力。第八章多媒体技术基础

由于声音和图像都是和时间相关的，因此，要求多媒体支持实时处理。这就要求多媒体系统在处理信息时有严格的时序要求和很高的速度要求。
3. 多媒体系统的交互性多媒体的另一个关键特性是交互性。多媒体系统采用人机对话方式，对计算机中存储的各种信息进行查找、编辑及同步播放，操作者可通过鼠标或菜单选择自己感兴趣的内容。交互性为用户提供了更加有效的控制和使用信息的手段和方法，这在计算机辅助教学、模拟训练、虚拟现实等方面有着巨大的应用前景。 4. 多媒体系统的实时性由于声音和图像都是和时间相关的，因此，要求多媒体支持实时处理。这就要求多媒体系统在处理信息时有严格的时序要求和很高的速度要求。第八章多媒体技术基础

多媒体技术中的媒体元素利用多媒体技术可以对声、文、图、像等进行处理，我们将这些多媒体处理对象称为媒体元素。媒体元素是指多媒体应用中可显示给用户的媒体组成部分。目前，多媒体技术处理的媒体元素主要包括文本、图像、动画、声音和视频影像五类信息。 1. 文本文本是以文字和各种专用符号表达的信息形式，它是现实生活中使用得最多的一种信息存储和传递方式。文本主要用于对知识的描述性表示，如阐述概念、定义、原理和问题以及显示标题、菜单等内容。如Word文字处理软件编辑出的“DOC”文件，记事本和写字板的“TXT”文件等。第八章多媒体技术基础

图像是多媒体软件中最重要的信息表现形式之一，它是决定一个多媒体软件视觉效果的关键因素。 3. 动画
2. 图像图像是多媒体软件中最重要的信息表现形式之一，它是决定一个多媒体软件视觉效果的关键因素。 3. 动画动画是利用人的视觉暂留特性，快速播放一系列连续运动变化的图形图像，也包括画面的缩放、旋转、变换、淡入淡出等特殊效果。通过动画可以把抽象的内容形象化。存储动画的文件格式有FLC、MMM、GIF、SWF等。 4. 声音声音是人们用来传递信息、交流感情最方便、最熟悉的方式之一。在多媒体中声音基本上分为音乐和音效两类。 5. 视频影像视频影像具有时序性与丰富的信息内涵，常用于说明事物的发展过程。视频非常类似于我们熟知的电影和电视，有声有色，在多媒体中充当重要的角色。视频文件的存储格式有AVI、MPG、MOV等。第八章多媒体技术基础

8.2 多媒体计算机系统的组成多媒体计算机系统是指能够对文字、图像、视频等多种媒体进行处理的计算机系统，即具有多媒体功能的计算机系统。到目前为止，大部分的多媒体应用是在PC机上进行的。平时常见的多媒体计算机都是多媒体个人计算机（Multimedia Personal Computer，简称MPC）。 MPC是能够输入、输出并综合处理文字、声音、图形、图像和动画等多种媒体信息的计算机，它将计算机软、硬件技术及数字化声像技术和高速通信网络技术等结合起来构成一个整体，使多媒体信息的获取、加工、处理、传输、存储和展示集于一体。简单地说，MPC就是一种具有多媒体信息处理功能的个人计算机。第八章多媒体技术基础

8.2.1 多媒体计算机硬件系统多媒体计算机软件系统第八章多媒体技术基础

8.2.1 多媒体计算机硬件系统与通用的PC机相比，多媒体计算机的主要硬件除了常规的硬件如主机、内存储器、软盘驱动器、硬盘驱动器、显示器和网卡之外，还要有光盘驱动器、音频信息处理硬件和视频信息处理硬件等部分。图9-1所示为具有基本功能的多媒体计算机硬件系统。多媒体计算机硬件系统示意图第八章多媒体技术基础

1. 声卡 2. 视频卡 3. 信息获取设备 4. 存储设备 5. 其他设备第八章多媒体技术基础

声卡声卡又称音频卡，是处理音频信号的硬件，目前已作为微机必备功能集成在主板上。我们从电脑中听到的美妙旋律都是来自于这块功能扩展卡。
1）声卡的组成声卡的类型众多，结构也不尽相同。一般来说，一块声卡至少应具有下列部件：第八章多媒体技术基础

早期的声卡是8位位宽，目前多数为32位及以上了。16位卡的采样精度可达到64K分之一，对多数应用均已足够了。
① 实现录音和放音的部件包括在声音输入过程中把模拟信号转换为数字信号的模数转换电路，以及在声音输出过程中把数字信号转换为模拟信号的数模转换电路。每种声卡都具有固定的采样参数。如果录音电路使用的参数是22.05 kHz和16位，放音电路也将使用同样的参数。早期的声卡是8位位宽，目前多数为32位及以上了。16位卡的采样精度可达到64K分之一，对多数应用均已足够了。第八章多媒体技术基础

② 支持乐器合成的MIDI合成器这是决定声卡音质的关键部件。由于MIDI音乐对质量的要求较高，许多声卡制造商致力于提高合成器的质量，使音乐合成技术不断获得改进。早期的合成器采用FM（频率调制）合成技术，通过用一个正弦波修正另一个正弦波的方法来模拟各种乐器的声音，带有较深的人工合成痕迹。现在流行的声卡普遍采用“波表”（Wave Table）合成技术，其中又有“硬波表”与“软波表”两种不同的方法。硬波表将各种真实乐器的数字化声音信息存储在声卡上的专用存储器中，使用时再由合成器调用并处理。软波表则将乐器的数字化声音信息存储在系统的硬盘上，待使用时再调入系统内存由CPU进行处理。软波表合成器显然比硬波表合成器便宜，但却增加了CPU的负担，对计算机系统的硬件尤其是CPU处理速度的要求也高得多。第八章多媒体技术基础

近几年随着PCI总线的流行而推出的PCI声卡，把硬波表和软波表的优点结合起来，提出了一种新的MIDI合成方案。其具体作法是：波表存储在硬盘上，使用时调入内存；但并非交给CPU处理，而是经PCI总线传回声卡，由声卡上的专用合成芯片处理。这一被称为“可下载样本”（Down Loadable Sample，简称DLS）的合成技术，现已成为新一代PCI声卡的标准。硬盘上的样本库可选择2 MB、4 MB乃至8 MB等不同的大小，音源与音质也可由用户选择，而且其内容可经常更新，使声卡的音频真正做到生动、灵活和多样。 ③ 连接声音设备的各种端口声卡是音频输入／输出设备的公用接口，也是沟通主机和音频设备的通道。通常在声卡的后端设有许多端口。安装声卡后，这些端口便伸出机箱外，供用户连接音箱、麦克风等音频设备。第八章多媒体技术基础

2）声卡的功能多媒体计算机中所安装的声卡的功能直接影响到多媒体系统的音频效果。一般声卡应具有以下功能： ① 录制和编辑音频文件
能以一定频率和精度采样声源的模拟波，并通过对其数字化，以*.voc、*.wav或*.au等声音文件格式存储。可以根据要求对音频文件做修改、编辑、文件类型转换等，如将*.voc文件转换成*.wav文件，还可以根据需要，将音频文件插入到其他应用程序中去。 ② 合成和播放音频文件利用声卡上的合成器将存储在计算机内存中的音频信息合成为音乐乐曲或语音。通过混合器混合和处理多个不同音频源的声音，控制和调节音量大小，最后送至音箱或耳机播放。第八章多媒体技术基础

④ 具有与MIDI设备和CD驱动器的连接功能
③ 压缩和解压缩音频文件通过对*.wav音频文件的存储量计算可知，一分钟的声音波形文件（44.1 kHz采样频率、16位精度和双声道立体声）的存储量高达10.6 MB，因而必须对音频进行编码压缩。大多数声卡上都固化了不同标准的音频压缩和解压缩软件，常用的压缩编码方法有ADPCM（自适应差分脉冲编码调制）和ACM（微软音频压缩管理器）等，压缩比大约为2:1～5:1。 ④ 具有与MIDI设备和CD驱动器的连接功能通过声卡上的MIDI接口，计算机可以同外界的MIDI设备相连接，如连接电子琴、电吉他等，使MPC机具有创作乐曲和播放MIDI文件的功能。游戏杆也可通过MIDI接口与计算机相连接，使游戏玩起来得心应手。通过声卡上提供的CD-ROM音频接口，CD-ROM驱动器可连接到计算机上。第八章多媒体技术基础

视频卡多媒体技术中的一大支柱是视频技术，它使得动态图像能在计算机中输入、编辑和播放。视频技术通过软、硬件都能实现，但目前用得较多的是视频卡。视频卡的种类大体可分为视频叠加卡、视频捕捉卡、电视编码卡、MPEG卡和TV卡。第八章多媒体技术基础

1）视频叠加卡视频叠加卡的功能是通过视频输入口输入标准的视频信号，经A/D转换后形成混合信号，再与计算机显示卡中的VGA信号相叠加，叠加后的信号显示在显示屏上。视频信号与VGA信号叠加的方式有窗口和色键两种。窗口方式是用软件命令在显示屏幕的任意位置上开设一个大小可指定的窗口，图像在该窗口内播放；色键方式是用户可利用软件命令自定义一种颜色为色键（透明色），同时定义该颜色是对VGA信号透明还是对视频信号透明。 2）视频捕捉卡视频捕捉卡又称视频采集卡，用于图像捕捉尤其适用于捕捉视频图像（如来自录像机的视频图像），经数字化后，将图像以AVI格式文件保存在磁盘上，供以后编辑使用。视频捕捉卡的档次拉得很大，较贵的视频捕捉卡往往带有视频压缩功能。这类卡主要供专业编辑人员使用，用量较少。第八章多媒体技术基础

3）电视编码卡其功能是将计算机送往VGA显示器的VGA显示信号转换成标准的NTSC、PAL或SECAM电视信号，因而可以将计算机上的影像传到电视机上观看。如果将转换后的标准电视信号加到录像机上，则可以记录计算机的显示画面，用于广告电视片的后期处理。电视编码卡转换的效果与其所支持的分辨率有关，分辨率越高，转换效果越好。 4）MPEG卡 MPEG卡又称视频播放卡或电影卡，是多媒体视频卡中应用最多的一种。MPEG卡的作用是将压缩存储在VCD影碟中的电影解压缩后回放，使用户可利用CD-ROM及显示器观看电影。MPEG卡的功能包括MPEG音频解压、MPEG视频解压、音频和视频同步解压。第八章多媒体技术基础

MPEG卡使用方便，用户界面良好，若与CD-ROM配合使用，可在计算机上欣赏VCD片或光盘中的MPEG电影。目前有两类MPEG卡，一类不带屏幕缩放功能，只能全屏幕播放MPEG电影；另一类带有屏幕缩放功能，不仅可以全屏幕播放，而且可以缩小电影播放的窗口，便于用交互方式进行操作控制，播放的质量也可满足一般用户的要求。 5）TV卡 TV卡由TV调谐卡和视频叠加卡合并构成，前者能通过高频头选择接收电视台的信号，把它们转换为视频信号；后者可将电视的视频信号与显示器的VGA信号叠加在一起，在计算机显示器上显示。有些TV卡上还设有视频输入口，可直接接收来自录像机或摄像机的视频信号。因此，利用TV卡除观看电视外，还可观看录像带或摄像机的画面。第八章多媒体技术基础

信息获取设备 1）数码相机（DC）数码相机是一种与计算机配套使用的照相机，与普通光学照相机之间最大的区别在于数码相机用存储器保存图像数据，而不通过胶片曝光来保存图像。（1）数码相机的工作原理。数码相机的心脏是电荷耦合器件(CCD)。使用数码照相机拍照时，图像被分成红、绿、蓝三种光线投影在电耦合器件上，CCD把光线转换成电荷，其强度与被摄物反射的光线强度有关，CCD把这些电荷送到模/数转换器，对光线数据进行编码，再储存到存储装置中。在软件支持下，可在屏幕上显示照片。照片可用彩色打印机输出。第八章多媒体技术基础

颜色深度描述数码相机对色彩的分辨能力。目前几乎所有的数码相机的颜色深度都达到了24位，可以生成真彩色的图像。
（2）数码相机的性能指标。 ① 分辨率：分辨率是数码相机最重要的性能指标。数码相机的分辨率标准与显示器类似，使用图像的绝对像素数来衡量。分辨率越高，所拍图像的质量也就越高，在同样的输出质量下可打印的照片尺寸越大。 ② 颜色深度：颜色深度描述数码相机对色彩的分辨能力。目前几乎所有的数码相机的颜色深度都达到了24位，可以生成真彩色的图像。 ③ 存储介质：数码相机所用的存储媒体是闪存记忆体，主要有Secure Digital Memory Card卡（SD卡）、Compact Flash卡（CF卡）。第八章多媒体技术基础

④ 数据输出方式：数码相机输出接口为串行口、USB接口或IEEE 1394接口。通过这些接口和电缆，就可将数码相机中的影像数据传递到计算机中保存或处理。若相机提供TV接口，可在电视机上观看照片。 ⑤ 连续拍摄：对于数码相机来说，当拍完一张照片之后，有一个将数据记录到内存的过程，不能立即拍摄下一张照片。两张照片之间等待的时间间隔就成为数码相机的另一个重要指标。越是高级的相机，间隔越短，也就是说连续拍摄的能力越强。第八章多媒体技术基础

（3）数码照片输入计算机。先用连接线将数码相机与计算机连接起来。例如，有USB接口的相机，将随机附带的电缆一端接入相机的输出接口，另一端插入计算机的USB接口。数码相机的驱动程序（需要事先安装到计算机上）就会将相机的存储卡视为计算机的一个可移动磁盘，存储卡中的图像会以略图方式显示。数码相机连结到计算机第八章多媒体技术基础

2）数码摄像机（DV）数码摄像机的优点是动态拍摄效果好，电池容量大，DV带也可以支持长时间拍摄，拍、采、编、播自成一体，相应的软、硬件支持也十分成熟。目前数码摄像机普遍都带有存储卡，一机两用切换起来也很方便。由于数码摄像机使用的小尺寸电荷耦合器件CCD与其镜头不匹配，在拍摄静止图像时的效果不如数码相机。数码摄像机上通常有S-Video、AV、DV In/Out等接口，其中DV In/Out接口是标准的数码输出/输入接口，它是一种小型的4针1394接口。第八章多媒体技术基础

使用摄像机与计算机相连的1394数据传输电缆线（亦称为Firewire缆线或iLink），一端连接计算机上的IEEE 1394卡上的接口，另一端接在数码摄像机的DV In/Out接口，然后打开DV的电源并把DV调到VCR状态，操作系统会自动识别DV设备。这时就可以启动采集编辑软件，将存储在DV带上的数码影像输入到计算机。反之，使用此缆线也可将编辑好的文件传回摄像机。如果要将DV上的数码影像输出到电视机，需要使用RCA线缆。RCA线缆包含了三个接头，其中红色代表右边的音频线路，白色代表左边的音频线路，黄色代表视频线路，两端的外观相同。摄像机与计算机连接示意图第八章多媒体技术基础

存储设备 1）CD-ROM 随着多媒体技术的迅速发展，光盘已成为MPC机中不可缺少的外部存储器之一。因为它与其他外存储器相比，有其独特的优点：存储容量大，制作成本低，不怕磁和热，工作稳定，密度高，寿命长，便于携带等。 CD-ROM驱动器简称光驱，其作用是通过伺服机构控制光盘的转速、控制光束的定位和焦距，以检测并读出光盘上所携带的信息。第八章多媒体技术基础

（1）CD-ROM光盘： CD-ROM光盘简称光盘，利用光存储技术实现数据的读／写操作。早在1980年，荷兰的飞利浦公司和日本索尼公司就发明了CD唱盘（或唱碟），可利用光反射原理重放记录在盘面上记录的音频信息。1983年出现了记录只读信息的“紧凑光盘”，称为CD-ROM（Compact Disc—Read Only Memory，简称CD-ROM）。但只是到1985年以后，随着多媒体技术的迅速发展，CD-ROM才应用到PC机中，成为MPC机中不可缺少的外部存储器之一。现在常用的CD-ROM光盘物理上共有三层结构，基体层是聚碳酸酯硬塑料，约1.2 mm厚；在基体上覆盖了一层极薄的铝箔，称为反射层，它是光盘的信息载体，所有数据均刻在这一层上；在上面覆盖了一层保护膜，以保护反射层免受损伤。第八章多媒体技术基础

在光盘的生产过程中，压盘机通过激光在空盘的表面以环绕方式刻出螺旋形的光道。光盘上存储信息是通过在光道上沿着盘面以凹坑的形式存储的，一张CD-ROM盘片约有30亿个凹坑，分布在螺旋形光道上，螺旋光道绕盘达2万周。相邻光道只相隔1.6 pm，相当于每英寸道，比软磁盘和硬盘的道密度高得多。由于分布在盘面的凹坑是机械性的，不像磁盘那样会受磁场的影响而丢失数据信息，因此，它具有保存数据稳定可靠、不易丢失、信息保存持久、抗干扰能力强等优点。在制作时，可以先用特殊的记录仪器把表示二进制数据的凹坑打到一个模子上，然后用热塑和压制工艺复制出大量的CD-ROM盘。常用的CD-ROM盘片的存储容量是650 MB容量。光盘盘片的容量又分为格式化容量和用户容量，采用不同的格式和不同的驱动器，光盘格式化后的容量不同。一般用户容量比格式化容量小，因为光盘还要存储有关控制、校验等信息。第八章多媒体技术基础

光盘按其读／写功能可分只读光盘、一次写多次读光盘和可重写光盘。
（2）光盘的分类：光盘按其读／写功能可分只读光盘、一次写多次读光盘和可重写光盘。 ① 只读光盘（CD-ROM）：即压缩光盘只读存储器。CD-ROM是最常用的光盘，其直径约12 cm，其容量650 MB，价格便宜。光盘是由母盘压模制成的，一旦复制成型则永久不变，用户只能读出信息，其信息存放标准是根据ISO 9660的黄皮书定义的。作为计算机的辅助存储器，它用于存放文字、图形、图像、声音等多媒体信息。 ② 一次写多次读光盘（WORM）：也称为CD-R（CD-Recordable）。WORM光盘在使用前首先要格式化，形成格式化信息区和逻辑目录区。WORM光盘引入了DOS文件分配表的概念，在光盘的根目录下面是用户定义的逻辑目录，逻辑目录对应文件管理区，其他各个文件目录项可以相应地浮动从而对应光盘的一切数据区，使得逻辑目录的转换同磁盘上目录转换一样方便。第八章多媒体技术基础

WORM光盘的特点是只有一次写操作多次读操作，需要专门的光盘刻录机才能完成数据的写入，所以记录信息时一定要慎重，一旦写入就不能再更改了。常见的一次性可写入光盘的容量为650 MB。
③ 可重写光盘（CD-RW）：可重写光盘或称可擦写光盘是最理想的光盘类型，也是最有应用前途的光盘类型。它像硬盘一样可读／写，利用浮动磁光头在磁光盘上进行磁场调制，可进行高速重写磁光记录。目前由于价格较贵，普及受到限制，随着技术不断进步，成本的降低，相信其有很好的应用前景。（3）CD-ROM驱动器与磁盘一样，要读出光盘上的信息也需要驱动器，对于CD-ROM来说，该驱动器称为CD-ROM驱动器，简称光驱。光驱有内置式和外置式两种，内置式装入机箱时，如果是老式机箱，一般预留5.25英寸软驱的位置；新式机箱则会预留光驱的位置。第八章多媒体技术基础

2）DVD光盘及其驱动器（1）DVD光盘： CD-ROM在多媒体的发展史上起了相当重要的作用，在网络还不发达的国家里CD是发行多媒体节目的主要手段。由于多媒体的数据量很大，近年来世界上开发了存储容量比CD大得多的DVD光盘存储器。DVD原名为Digital Video Disc的缩写，意思是“数字视频光盘”，这是为了与VCD（Video CD）相区别。实际上，DVD不仅仅可以用来存放影视节目，同样可以用来存储其他类型的数据，因此后来把Digital Video Disc更名为Digital Versatile Disc，它的缩写仍然是DVD，Versatile的意思是多才多艺的意思。与CD—ROM相比，DVD使用波长更短的红色激光，可读取更小的凹坑和更密的光道。DVD盘与现在使用的CD盘相比，在形状、尺寸、面积、重量方面都一样，也都是用塑料做衬底的金属盘，但同样大小的DVD有更大的存储容量。现在定义的DVD的存储容量最高可达到17 GB，一片DVD盘的容量相当于25片CD-ROM（650 MB）的容量。第八章多媒体技术基础

② DVD-R驱动器：是一次性写入型DVD驱动器，也称为DVD刻录机，在原理上和CD-R有些相似，只能一次写入数据，但可以重复读出。
DVD驱动器是对DVD光盘进行读／写操作的设备。根据不同的读／写操作性质可分为DVD-ROM驱动器、DVD-R驱动器、DVD-RW驱动器和DVD-RAM驱动器。 ① DVD—ROM驱动器：是只读型的DVD产品，与现在常用的CD-ROM驱动器作用相似。驱动器的一倍速是1.3 MB/s。DVD-ROM可看成是CD-ROM的后继产品，因为它向下兼容，所以DVD-ROM驱动器可读音频CD和CD-ROM。对于CD-R／RW盘片的支持则要看使用的DVD-ROM驱动器是否支持。 ② DVD-R驱动器：是一次性写入型DVD驱动器，也称为DVD刻录机，在原理上和CD-R有些相似，只能一次写入数据，但可以重复读出。 ③ DVD-RW驱动器：是可擦写数千次的DVD驱动器，采用了类似CD-RW的相变技术。（3）DVD-RAM驱动器： DVD-RAM驱动器是可擦写型的DVD驱动器，它是DVD协会确定和公布的新的可擦写DVD驱动器标准。DVD-RAM也采用相变技术来擦写信息，可重复擦写十万次以上。第八章多媒体技术基础

其他设备为适应实际应用中的不同需要，计算机经常需要配置其他硬件设备，如扫描仪、触摸屏、影碟机、音响设备等。第八章多媒体技术基础

多媒体计算机软件系统多媒体计算机的应用除了要具有一定的硬件设备外，更重要的是软件系统的开发和应用。多媒体计算机的软件系统由多媒体系统软件、多媒体工具和多媒体应用软件组成。第八章多媒体技术基础

1）多媒体系统软件多媒体系统软件除了具有一般系统软件的特点外，还要反映多媒体技术的特点，如数据压缩、媒体硬件接口的驱动、新型交互方式等。多媒体计算机系统的主要系统软件包括多媒体驱动软件和接口程序、多媒体操作系统。 ① 多媒体驱动软件和接口程序：多媒体驱动软件和接口程序是最底层硬件的支撑环境，它直接与计算机硬件相关，完成设备初始化、设备的打开和关闭、设备操作、基于硬件的压缩/解压缩、图像快速变换及功能调用等。通常驱动软件有视频子系统、音频子系统及视频/音频信号获取子系统。接口程序是高层软件与驱动程序之间的接口软件，为高层软件建立虚拟设备。 ② 多媒体操作系统：多媒体操作系统实现多媒体环境下多任务调度，保证音频、视频同步控制及信息处理的实时性，提供多媒体信息的各种基本操作和管理。操作系统还独立于硬件设备和具有较强的可扩展性。第八章多媒体技术基础

多媒体工具包括多媒体编辑工具和多媒体创作工具两大类。 ① 多媒体素材制作工具：
2）多媒体工具多媒体工具包括多媒体编辑工具和多媒体创作工具两大类。 ① 多媒体素材制作工具：多媒体素材制作工具及多媒体库函数为多媒体应用程序进行数据准备的软件，主要是多媒体数据采集软件，作为开发环境的工具库，供开发者调用。多媒体素材制作工具按功能可分为文本素材编辑工具、图形素材编辑工具、图像素材编辑工具、声音素材及MIDI音乐的编辑工具、动画素材编辑工具和视频影像素材编辑工具等。 ② 多媒体创作工具：多媒体创作工具是在多媒体操作系统上进行开发的软件工具，用于编辑生成多媒体应用软件。多媒体创作工具提供将媒体对象集成到多媒体产品中的功能，并支持各种媒体对象之间的超级链接以及媒体对象呈现时的过渡效果。多媒体创作工具大都提供文本及图形的编辑功能，但对复杂的媒体对象，如声音、动画以及视频影像等的创建和编辑，还需借助多媒体素材编辑类工具软件。第八章多媒体技术基础

3）多媒体应用软件多媒体应用软件是根据多媒体系统终端用户要求而定制的应用软件或面向某一领域的用户应用软件系统，它是面向大规模用户的系统产品，如媒体播放软件、辅助教学软件、游戏软件、电子工具书和电子百科全书等。第八章多媒体技术基础

8.3 多媒体技术多媒体技术是利用计算机综合处理声、文、图等信息的综合技术。多媒体技术的研究涉及多个方面，如计算机体系结构、数值处理技术、编辑技术、声音信号处理、图形学及图像处理、动态技术、人工智能、计算机网络和高速通信技术等。第八章多媒体技术基础

8.3.1 多媒体技术研究的主要方向 8.3.2 音频信息处理 8.3.3 图像信息处理 8.3.4 视频处理 8.3.5 虚拟现实
多媒体技术研究的主要方向音频信息处理图像信息处理视频处理虚拟现实流媒体第八章多媒体技术基础

多媒体技术研究的主要方向多媒体涉及的技术范围很广，是多种学科和多种技术交叉的领域。目前，多媒体技术研究的主要方向有以下几个方面： 1）多媒体数据的表示技术包括文字、声音、图形、图像、动画、影视等媒体在计算机中的表示方法。由于多媒体的数据量大得惊人，尤其是声音和影视，包括高清晰度数字电视（High Definition Television，简称HDTV）这类的连续媒体，为克服数据传输通道带宽和存储器容量的限制，投入了大量的人力和物力来开发数据压缩和解压缩技术；人—机接口技术，如语音识别和文本—语音转换（Text To Speech，简称TTS）也是多媒体研究中的重要课题；虚拟现实（Virtual Reality，简称VR）是当今多媒体技术研究中的热点技术之一。第八章多媒体技术基础

基本目标是功能强大、适应性强、使用方便等，为将来人人都会使用多媒体创作和编辑工具提供了条件。
2）多媒体数据的存储技术多媒体数据的存储的目标是实现大容量信息的存储和管理。在发展集中式的海量存储技术的同时，也在向分布存储、并行访问的方向发展。分布数据存储技术与多媒体存储技术将在计算机通信网络中融合起来。 3）多媒体的应用开发包括多媒体CD-ROM节目（Title）制作、多媒体数据库、环球超媒体信息系统（Web）、多目标广播技术（Multicasting）、影视点播（Video On Demand，简称VOD）、电视会议（Video Conferencing）、远程教育系统、多媒体信息的检索等。 4）多媒体创作和编辑工具的研究开发基本目标是功能强大、适应性强、使用方便等，为将来人人都会使用多媒体创作和编辑工具提供了条件。第八章多媒体技术基础

音频信息处理多媒体技术的特点是交互式地综合处理声音、文字和图像等多种信息。在多媒体系统中，语音和音乐是必不可少的，没有音频的视频是不可接受的。音频和视频同步，使视频图像更具真实性。娓娓动听的音乐和解说，使静态图像变得更加丰富多彩。可视电话、电视会议中的声音更为重要。第八章多媒体技术基础

声波是随时间连续变化的模拟量，它有以下三个重要指标： 1）振幅声波的振幅通常是指音量，它是声波波形的高低幅度，表示声音信号的强弱程度。
1. 声音的基本概念声音是人类进行交流和认识自然的主要媒体形式。从本质上说，声音是通过一定介质（如空气、水等）传播的一种连续的波，在物理学中称为声波。声音的强弱体现在声波的振幅上，音调的高低体现在声波的周期或频率上。声波是随时间连续变化的模拟量，它有以下三个重要指标： 1）振幅声波的振幅通常是指音量，它是声波波形的高低幅度，表示声音信号的强弱程度。 2）周期声音信号的周期是指两个相邻声波之间的时间长度，即重复出现的时间间隔，以秒为单位。 3）频率声音信号的频率是指信号每秒钟变化的次数，即为周期的倒数，以赫兹(Hz)为单位。声音质量是用声音信号的频率范围来衡量，频率范围又叫频域或频带，不同种类的声源其频带也不同。一般而言，声源的频带越宽，表现力越好，层次越丰富。第八章多媒体技术基础

把模拟声音信号转变为数字声音信号的过程称为声音的数字化，它是通过对声音信号进行采样、量化和编码来实现的。
2. 声音的数字化声音是一种具有一定的振幅和频率且随时间变化的声波，通过话筒等转化装置可将其变成相应的电信号，但这种电信号是一种模拟信号，不能由计算机直接处理，必须先对其进行数字化，即将模拟的声音信号经过模数转换器ADC变换成计算机所能处理的数字声音信号，然后利用计算机进行存储、编辑或处理。在数字声音回放时，由数模转换器DAC将数字声音信号转换为实际的声波信号，经放大由扬声器播出。把模拟声音信号转变为数字声音信号的过程称为声音的数字化，它是通过对声音信号进行采样、量化和编码来实现的。第八章多媒体技术基础

把采样得到的信号幅度的样本值从模拟量转换成数字量。数字量的二进制位数是量化精度。在MPC中，量化精度标准定为8位、16位。
1）采样以固定的时间间隔（采样周期）抽取模拟信号的幅度值。采样后得到的是离散的声音振幅样本序列，仍是模拟量。采样频率越高，声音的保真度越好，但采样获得的数据量也越大。在MPC中，采样频率标准定为11.25kHz、22.05kHz、44.1kHz。 2）量化把采样得到的信号幅度的样本值从模拟量转换成数字量。数字量的二进制位数是量化精度。在MPC中，量化精度标准定为8位、16位。采样和量化过程称为模/数（A/D）转换。 3）编码把数字化声音信息按一定数据格式表示。第八章多媒体技术基础

3. 音频文件的格式音频数据都是以文件的形式保存在计算机中。音频的文件格式主要有WAV、MP3、WMA等，专业数字音乐工作者一般都使用非压缩的WAV格式进行操作，而普通用户更乐于接受压缩率高、文件容量相对较小的：MP3或WMA格式。 1）WAV格式这是Microsoft和IBM共同开发的PC标准声音格式。由于没有采用压缩算法，因此无论进行多少次修改和剪辑都不会产生失真，而且处理速度也相对较快。对WAV格式音频文件的支持是迄今为止最为广泛的，几乎所有的播放器都能播放，而电子幻灯片、各种算法语言、多媒体工具软件都能直接使用。但是，波形文件的数据量比较大，其数据量的大小直接与采样频率、量化位数和声道数成正比。第八章多媒体技术基础

2）MP3格式 MP3（MPEG Audio layer 3）文件格式是用一种按MPEG标准的音频压缩技术制作的数字音频文件，它是一种有损压缩，通过记录未压缩的数字音频文件的音高、音色和音量信息，在它们的变化相对不大时，用同一信息替代，并且用一定的算法对原始的声音文件进行代码替换处理，这样就可以将原始数字音频文件压缩得很小，可得到11:1的压缩比。因此，一张可存储15首歌曲的普通CD光盘，如果采用MP3文件格式，即可存储超过160首CD音质的MP3歌曲。第八章多媒体技术基础

WMA文件可以通过在保证只有MP3文件一半大小的前提下保持相同的音质。同时，现在的大多数MP3播放器都支持WMA文件。
3）CD格式 CD格式的音频文件扩展名为.cda。标准CD格式的采样频率为44.1kHz，量化位数为16bit，速率为176KB/s。CD音轨是近似无损的，因此它的声音基本保真度高。 .cda文件只是一个索引信息，并不是真正的包含声音信息，所以在计算机上看到的.cda文件都是44B。不能直接复制CD格式的.cda文件到硬盘上播放，需要使用音频抓轨软件进行格式转换。 4）WMA格式 WMA（Windows Media Audio）文件是Windows Media格式中的一个子集，而windows Media格式是由Microsoft Windows Media技术使用的格式，包括音频、视频或脚本数据文件，可用于创作、存储、编辑、分发、流式处理或播放基于时间线的内容。 WMA文件可以通过在保证只有MP3文件一半大小的前提下保持相同的音质。同时，现在的大多数MP3播放器都支持WMA文件。第八章多媒体技术基础

图像信息处理图像是多媒体中携带信息的极其重要的媒体，有人发表过统计资料，认为人们获取的信息的70%来自视觉系统，实际就是文字、图像和视频。人们最易接受的是图像和视频，而视频也是由图像组成的，可见图像在多媒体中的重要性。第八章多媒体技术基础

1. 图形与图像 2. 图像的数字化 3. 图像压缩标准 4. 图像的文件格式第八章多媒体技术基础

图形与图像计算机绘制的图片有两种形式：图形和图像。
图形又称矢量图形或几何图形，它是用一组指令来描述的，这些指令给出构成该画面的所有直线、曲线、矩形、椭圆等的形状、位置、颜色等各种属性和参数。这种方法实际上是用数学方法来表示图形，然后变成许许多多的数学表达式，再编制程序，用语言来表达。计算机在显示图形时从文件中读取指令并转化为屏幕上显示的图形效果。图像又称点阵图像或位图图像，它是指在空间和亮度上已经离散化的图像。可以把一幅位图图像理解为一个矩形，矩形中的任一元素都对应图像上的一个点，在计算机中对应于该点的值为它的灰度或颜色等级。这种矩形的元素就称为像素，像素的颜色等级越多则图像越逼真。因此，图像是由许许多多像素组合而成的。第八章多媒体技术基础

图像的数字化图像只有经过数字化后才能成为计算机处理的位图。自然景物成像后的图像无论以何种记录介质保存都是连续的。从空间上看，一幅图像在二维空间上都是连续分布的，从空间的某一点位置的亮度来看，亮度值也是连续分布的。图像数字化就是把连续的空间位置和亮度离散，它包括两方面的内容：空间位置的离散和数字化，亮度值的离散和数字化。把一幅连续的图像在二维方向上分成m×n个网格。每个网格用一个亮度值表示，这样一幅图像就要用m×n个亮度值表示，这个过程称为采样。正确选择m、n，才能使数字化的图像质量损失最小，显示时才能得到完美的图像质量。采样的图像亮度值，在采样的连续空间上仍然是连续值。把亮度分成k个区间，某个区间对应相同的亮度值，共有k个不同的亮度值，这个过程称为量化。通常将实现量化的过程称为模数变换；相反，把数字信号恢复到模拟信号的过程称为数模变换，它们分别由A/D和D/A变换器实现。经过模-数变换得到的数字数据可以进一步压缩编码，以减少数据量。第八章多媒体技术基础

响图像数字化质量的主要参数有分辨率、颜色深度等，在采集和处理图像时，必须正确理解和运用这些参数。 1）分辨率
分辨率是影响图像质量的重要参数，它可以分为显示分辨率、图像分辨率和像素分辨率等。（1）显示分辨率。显示分辨率是指在显示器上能够显示出的像素数目，它由水平方向的像素总数和垂直方向的像素总数构成。例如，某显示器的水平方向为1024像素，垂直方向为768像素，则该显示器的显示分辨率为1024×768。显示分辨率与显示器的硬件条件有关，同时也与显示卡的缓冲存储器容量有关，其容量越大，显示分辨率越高。在同样大小的显示器屏幕上，显示分辨率越高，像素的密度越大，显示图像越精细，但是屏幕上的文字越小。（2）图像分辨率。图像分辨率是指数字图像的实际尺寸，反映了图像的水平和垂直方向的大小。图像分辨率越高，像素就越多，图像所需要的存储空间也就越大。第八章多媒体技术基础

（3）像素分辨率。像素分辨率是指显像管荧光屏上一个像素点的宽和长之比，在像素分辨率不同的机器间传输图像时会产生图像变形。 2）颜色深度
颜色深度是指记录每个像素所使用的二进制位数。对于彩色图像来说，颜色深度决定了该图像可以使用的最多颜色数目；对于灰度图像来说，颜色深度决定了该图像可以使用的亮度级别数目。颜色深度值越大，显示的图像色彩越丰富，画面越自然、逼真，但数据量也随之激增。实际应用中，彩色图像或灰度图像的颜色分别用4位、8位、16位、24位和32位等二进制数表示。图像文件的大小是指在磁盘上存储整幅图像所需的字节数，它的计算公式是：图像文件的字节数=图像分辨率×颜色深度/8 显然，图像文件所需要较大的存储空间。在制作多媒体应用软件时，一定要考虑图像的大小。因此对图像文件进行压缩处理，从而减少图像文件所占用的存储空间是非常必要的。第八章多媒体技术基础

图像压缩标准 1）二值图像压缩（JBIG）二值图像压缩标准有G3、G4和JBIG。以非自适应、一维游程编码为基础，JBIG采用无损压缩技术，但它的压缩率比目前的CCITT G3、G4标准高1.1～30倍（根据内容的不同）。虽然JBIG是二值图像的编码标准，但也可以对含灰度值的图像或彩色图像进行无失真压缩。 2）静止图像压缩标准（JPEG/JPEG 2000）为了压缩连续色调（即灰度级或彩色）的静止图像，联合图片专家组（Joint Photographic Expert Group，简称JPEG，1986年成立）于1991年3月提出了ISO/IEC l0918号建议草案《连续色调静止图像的数字压缩编码》（Digital Compression and Coding of Continuous-tone Still Images），1992年正式通过。JPEG标准采用混合编码方法，可以支持很高的图像分辨率和量化精度。JPEG算法的平均压缩比为15:1，当压缩比大于50时将可能出现方块效应。这一标准适用于黑白及彩色照片、传真和印刷图片。 JPEG 2000是一个新标准，不仅提高了对图像的压缩质量，还可根据图像质量、视觉感受和分辨率进行渐进传输。第八章多媒体技术基础

3）动态图像压缩标准（H.261） CCITT在1990年12月通过了H.261即p×64 Kb/s视听业务用的视频编解码器（Video Coder/Decoder for Audiovisual Services at p×64 Kb/s）。这个建议是针对运动实时动态图像的压缩编码和解码，应用目标是可视电话和电视会议。算法采用混合编码方法，压缩比可达48:1。它的原理框架奠定了以后MPEG标准的基础。 4）动态图像压缩标准（MPEG-1）动态图片专家组（Moving Picture Expert Group，简称MPEG）提出的“用于数字存储媒体运动图像及其伴音率为1.5 Mb/s的压缩编码”，简称MPEG-1，它包括三个部分：MPEG视频、MPEG音频和MPEG系统。MPEG-1标准的平均压缩比为50:1，其处理能力可达到360×240像素。第八章多媒体技术基础

5）动态图像压缩标准（MPEG-2/H.262） 1996年底正式公布的MPEG-2标准引用了MPEG-1标准的基本结构，并作了扩展。它可以直接对隔行扫描视频信号进行处理；空间分辨率、时间分辨率和信噪比可分级，以适应不同用途的解码要求；输出码流速率可以是恒定的也可以是变化的，以适应同步和异步传输。 MPEG-2标准的处理能力可达广播级水平，即720×480像素。MPEG-2标准兼容MPEG-1标准，适应1.5～80 Mb/s编码范围。MPEG-2标准也是高清晰度电视（HDTV）全数字方案、DVD方案所采用的数据压缩标准。 6）动态图像压缩标准（MPEG-4/H.263） MPEG-4是ISO为传输码率低于64 Kb/s的实时图像设计的。与JPEG、MPEG-1、MPEG-2等其他标准所采用的基本压缩算法不同，该标准采用基于模型的编码、分形编码等方法，以获得极低码率的压缩效果，所涉及的应用范围覆盖了有线、无线、移动通信、Internet以及数字存储回放等各个领域。它在信息描述中首次采用了“对象”（Object）概念，是以内容为中心的描述方法，对信息元的描述更符合人的心理，不仅获得比原有标准更优越的压缩性能，也提供了各种新功能的应用。第八章多媒体技术基础

图像的文件格式常用的图像文件格式有BMP、GIF、JPEG和PNG等，大多数图像软件都可以支持多种格式的图像文件，以适应不同的应用环境。
1）BMP格式。BMP(Bitmap)是Microsoft公司为其Windows系列操作系统设置的标准图像文件格式。由于Windows操作系统在PC上占有绝对的优势，所以在PC上运行的绝大多数图像软件都支持BMP格式的图像文件。 2）GIF格式 GIF（Graphics Interchange Format）是由CompuServe公司于1987年开发的图像文件格式。它主要是用来交换图片的，为网络传输和BBS用户使用图像文件提供方便。大多数图像软件都支持GIF文件格式，它特别适合于动画制作、网页制作及演示文稿制作等领域。第八章多媒体技术基础

3）JPEG格式 JPEG（Joint Photographic Experts Group）是一种比较复杂的文件结构和编码方式的文件格式。它是用有损压缩方式去除冗余的图像和彩色数据，在获得极高压缩率的同时能展现十分丰富和生动的图像。换句话说，就是可以用最少的磁盘空间得到较好的图像质量。因此，JPEG文件格式适用于互联网上用作图像传输，常在广告设计中作为图像素材，在存储容量有限的条件下进行携带和传输。。 4）PNG格式 PNG（Portable Network Graphic）是一种能存储32位信息的位图文件格式，其图像质量远胜过GIF。同GIF一样，PNG也使用无损压缩方式来减少文件的大小。在压缩位图数据时，它采用了颇受好评的LZ77算法的一个变种。目前，越来越多的软件开始支持这一格式。与GIF不同的是，PNG图像格式不支持动画。第八章多媒体技术基础

视频处理视频信息是连续变化的影像，通常是指实际场景的动态演示，例如电影、电视、摄像资料等。视频信息带有同期音频，画面信息量大，表现的场景复杂，常采用专门的软件对其进行加工、修改。第八章多媒体技术基础

1. 视频的基本概念 2. 视频的数字化 3. 视频压缩标准 4. 视频文件的格式第八章多媒体技术基础

视频的基本概念连续的图像变化每秒超过24帧（Frame）画面时，根据视觉暂留原理，人眼无法辨别每幅单独的静态画面，看上去是平滑连续的视觉效果。这样的连续画面叫做视频。当连续图像变化每秒低于24帧画面时，人眼有不连续的感觉，叫做动画（Cartoon）。第八章多媒体技术基础

视频的数字化模拟视频数据流进入计算机时，每帧画面均应对每一像素进行采样，并按颜色或灰度量化，故每帧画面均形成一幅数字图像。对视频按时间逐帧进行数字化得到的图像序列即为数字视频。因此，可以说图像是离散的视频，而视频是连续的图像。视频数字化后，能做到许多模拟视频无法实现的事情。数字视频的主要优点如下：第八章多媒体技术基础

通过网络，数字视频可以很方便地进行长距离传输，以实现视频资源共享。而模拟视频在传输过程中容易产生信号的损耗与失真。
1）便于处理模拟视频只能简单地调整亮度、对比度和颜色等，因此限制了处理手段和应用范围。而数字视频由于可以储存到计算机中，因此很容易进行创造性的编辑与合成，并可进行动态交互。 2）再现性好由于模拟信号是连续变化的，所以复制时失真不可避免，经过多次复制，误差就很大。而数字视频可以不失真地进行多次复制，其抗干扰能力是模拟视频无法比拟的。它不会因复制、传输和存储而产生图像质量的退化，从而能够准确地再现视频图像。 3）网络共享通过网络，数字视频可以很方便地进行长距离传输，以实现视频资源共享。而模拟视频在传输过程中容易产生信号的损耗与失真。第八章多媒体技术基础

视频压缩标准视频数据的编码和压缩是以声音与图像编码和压缩为基础的，主要采用的是MPEG系列标准，我们在前面已经介绍，这里不再重复。
第八章多媒体技术基础

视频文件的格式视频格式可以分为适合本地播放的本地影像视频和适合在网络中播放的网络流媒体影像视频两大类。第八章多媒体技术基础

1）本地影像视频（1）AVI格式：音频视频交错（Audio Video Interleaved）格式，AVI格式允许视频和音频交错在一起同步播放，一般用于保存电影、电视等各种影像信息，有时它也出没于Internet中，主要用于让用户欣赏新影片的精彩片段。常用的AVI播放驱动程序，主要有Microsoft Video for Windows，以及Intel公司的Indeo Video等。（2）MPEG/MPG/DAT格式：MPEG是运动图像压缩算法的国际标准，现已被几乎所有的计算机平台所支持。MPEG压缩标准是针对运动图像而设计的，其基本方法是：在单位时间内采集并保存第一帧信息，然后只存储其余帧相对第一帧发生变化的部分，从而达到压缩的目的。MPEG的平均压缩比为50∶1，最高可达200∶1，压缩效率高。同时图像和音响的质量也非常好，并且在微机上有统一的标准格式，兼容性相当好。MPEG标准包括MPEG视频、MPEG音频和MPEG系统(视频、音频同步)三个部分，MP3音频文件就是MPEG音频的一个典型应用，而Video CD(VCD)、Super VCD(SVCD)、DVD(Digital Versatile Disk)则是全面采用MPEG技术所产生出来的消费类电子产品。第八章多媒体技术基础

2）网络视频格式（1）RM格式：它是Real Networks公司所制定的音频/视频压缩规范Real Media中的一种，Real Player能利用Internet资源对这些符合Real Media技术规范的音频/视频进行实况转播。在Real Media规范中主要包括三类文件，即Real Audio、Real Video和Real Flash（Real Networks公司与Macromedia公司合作推出的新一代高压缩比动画格式）。Real Video（RA、RAM）格式一开始就定位在视频流应用方面，是视频流技术的始创者，它可以在用56k Modem拨号上网的条件下实现不间断的视频播放，其图像质量比VCD差。（2）MOV格式：QuickTime是Apple公司用于Macintosh计算机上的一种图像视频处理软件，它提供了两种标准图像和数字视频格式，即可以支持静态的PIC和JPG图像格式，动态的基于Indeo压缩法的MOV和基于MPEG压缩法的MPG视频格式。第八章多媒体技术基础

（3）ASF格式：ASF (Advanced Streaming Format高级流格式)是微软为了和现在的Real Player竞争而发展出来的一种可以直接在网上观看视频节目的文件压缩格式。ASF使用了MPEG-4的压缩算法，压缩率和图像的质量都很不错。（4）WMV格式：WMV的英文全称为Windows Media Video，是一种独立编码的在Internet上实时传播多媒体的技术标准，Microsoft公司希望用其取代QuickTime之类的技术标准以及.wav、.avi之类的文件扩展名。WMV的主要优点在于：可扩充的媒体类型、本地或网络回放、可伸缩的媒体类型、流的优先级化、多语言支持、扩展性等。第八章多媒体技术基础

8.3.5 虚拟现实 1. 虚拟现实的概念 2. 虚拟现实技术的主要特征 3. 虚拟现实系统的分类 4. 虚拟现实系统的组成
虚拟现实 1. 虚拟现实的概念 2. 虚拟现实技术的主要特征 3. 虚拟现实系统的分类 4. 虚拟现实系统的组成 5. 分布式虚拟现实系统的应用第八章多媒体技术基础

虚拟现实的概念虚拟现实（VR，Virtual Reality）技术也称虚拟灵境或人工环境，是一种可以创建和体验虚拟世界的计算机系统。它利用计算机技术生成一个逼真的具有视、听、触等多种感知的虚拟环境，用户通过使用各种交互设备，同虚拟环境中的实体相互作用，使之产生身临其境感觉的交互式视景仿真和信息交流。它是一种先进的数字化人机接口技术。第八章多媒体技术基础

虚拟现实技术的主要特征虚拟现实技术与传统的模拟技术相比，其主要特征是：（1）操作者能够真正进入一个由计算机生成的交互式三维虚拟环境中，与之产生互动，进行交流。通过参与者与仿真环境的相互作用，并借助人本身对所接触事物的感知和认知能力，帮助启发参与者的思维，以全方位地获取虚拟环境所蕴涵的各种空间信息和逻辑信息。（2）沉浸/临场感和实时交互性是虚拟现实的实质性特征，对时空环境的现实构想（即启发思维，获取信息的过程）是虚拟现实的最终目的。理想的虚拟现实系统应该具有多感知能力，提供人类所具有的一切感知能力，包括视觉、听觉、触觉、味觉与嗅觉。自从虚拟现实技术诞生以来，它已经在军事模拟、先进制造、城市规划/地理信息系统、医学生物等领域中显示出巨大的经济、军事和社会效益，与网络、多媒体并称为21世纪最具应用前景的三大技术。第八章多媒体技术基础

虚拟现实系统的分类虚拟现实系统就是要利用各种先进的硬件技术与软件工具，设计出合理的硬件、软件及交互手段，使参与者能交互式地观察与操纵系统生成的虚拟世界。根据用户参与虚拟现实的不同形式，可把虚拟现实系统划分成四类：第八章多媒体技术基础

1）桌面式虚拟现实系统桌面式虚拟现实系统也称为简易型虚拟现实系统，它是利用个人计算机和低级工作站进行仿真，将计算机的屏幕作为用户观察虚拟环境的一个窗口，使用者通过键盘、鼠标便可与虚拟环境进行交互。这种系统的特点是结构简单、价格低廉，因此应用比较广泛，是一套经济实用的系统。但桌面式虚拟现实系统会受到周围现实环境的干扰，参与者缺少完全的沉浸，缺乏真实的现实体验。 2）沉浸式虚拟现实系统沉浸式虚拟现实系统是一种高级的虚拟现实系统，它提供一个完全沉浸的体验，使用户有一种置身于虚拟环境之中的感觉。它利用头盔式显示器或其他设备，把参与者的视觉、听觉和其他感觉封闭起来，并提供一个新的、虚拟的感觉空间，并利用位置跟踪器、数据手套、其他手控输入设备、声音等使得参与者产生一种身临其境、全心投入和沉浸其中的感觉。沉浸式虚拟现实系统是一套比较复杂的系统，它的优点是用户全身心地沉浸到虚拟世界中去，缺点是系统设备价格高昂，难以普及推广。第八章多媒体技术基础

3）增强式虚拟现实系统增强式虚拟现实系统是把真实环境和虚拟环境组合在一起的一种系统，它既允许用户看到真实世界，同时也可以看到叠加在真实世界的虚拟对象，这种系统既可减少对构成复杂真实环境的计算，又可对实际物体进行操作，真正达到亦真亦幻的境界。 4）分布式虚拟现实系统分布式虚拟现实系统是利用远程网络，将异地的不同用户联结起来，多个用户通过网络同时参加一个虚拟空间，共同体验虚拟经历，对同一虚拟世界进行观察和操作，达到协同工作的目的，从而将虚拟现实的应用提升到了一个更高的境界。第八章多媒体技术基础

虚拟现实系统的组成虚拟现实系统由输入部分、输出部分、虚拟环境数据库、虚拟现实软件组成。第八章多媒体技术基础

虚拟现实系统通过输入部分接收来自用户的信息。用户基本输入信号包括用户的头、手位置及方向、声音等。其输入设备主要有：
1）输入部分虚拟现实系统通过输入部分接收来自用户的信息。用户基本输入信号包括用户的头、手位置及方向、声音等。其输入设备主要有：（1）数据手套：用来监测手的姿态，将人手的自然动作数字化。用户手的位置与方向用来与虚拟环境进行交互。如在使用交互手套时，手势可用来启动或终止系统。类似地，手套可用来拾起虚拟物体，并将物体移到别的位置。（2）三维球：用于物体操作和飞行控制。（3）自由度鼠标：用于导航、选择及与物体交互。（4）生物传感器：用来跟踪眼球运动。（5）头部跟踪器：通常装在HMD头盔上跟踪头部位置，以便使HMD显示的图像随头部运动而变化。用户头的位置及方向是系统重要的输入信号，因为它决定了从哪个视角对虚拟世界进行渲染。（6）语音输入设备：通过话筒等声音输入设备将语音信息输入，并利用语音识别系统将语音信号变成数字化信号。第八章多媒体技术基础

2）输出系统虚拟现实系统根据人的感觉器官的工作原理，通过虚拟现实系统的输出设备，使人对虚拟现实系统的虚拟环境得到虽假犹真、身临其境的感觉。主要是由三维图像视觉效果、三维声音效果和触觉（力觉）效果来实现的。（1）三维图像生成与显示：利用图形处理器、立体图像显示设备、高性能计算机系统将计算机数字信号变成三维图像。最简单的一种是计算机监视器加上一副眼镜，另一种就是头盔显示器。（2）三维声音处理：虚拟现实系统声音效果包括音响和语音效果。通过有关的声音设备使电子信号变成立体声，并提供识别立体声声源和判定其空间方位的功能。（3）触觉、力觉反馈：触觉提供手握物体时获得的丰富感觉信息，包括分辨表面材质及温度、湿度、厚度、张力等。用户的手是与虚拟环境进行自然交互时的重要途径。当手与虚拟物体发生碰撞时，我们自然希望有接触感和压力感。第八章多媒体技术基础

虚拟环境数据库的作用是存放整个虚拟环境中所有物体的各方面信息，包括物体及其属性如约束、物理性质、行为、几何、材质等。
3）虚拟环境数据库虚拟环境数据库的作用是存放整个虚拟环境中所有物体的各方面信息，包括物体及其属性如约束、物理性质、行为、几何、材质等。虚拟环境数据库由实时系统软件管理。虚拟环境数据库中的数据只加载用户可见部分，其余留在磁盘上，需要时导入内存。 4）虚拟现实软件虚拟现实软件任务是设计用户在虚拟环境中遇到的景和物。构建虚拟环境的过程如下：（1）三维物体的建模。典型的建模软件有AutoCAD、Multigen、VRML等。（2）虚拟场景的建立及三维物体与虚拟场景的集成。典型的虚拟现实软件有Vega、OpenGVS、VRT、Vtree等。第八章多媒体技术基础

分布式虚拟现实系统的应用分布式虚拟现实系统在远程教育、工程技术、建筑、电子商务、交互式娱乐、远程医疗、大规模军事训练等领域都有着极其广泛的应用前景，利用它可以创建多媒体通信、设计协作系统、实境式电子商务、网络游戏、虚拟社区全新的应用系统。典型的应用领域有：第八章多媒体技术基础

1）教育应用把分布式虚拟现实系统用于建造人体模型、电脑太空旅游、化合物分子结构显示等领域，由于数据更加逼真，大大提高了人们的想象力、激发了受教育者的学习兴趣，学习效果十分显著。同时，随着计算机技术、心理学、教育学等多种学科的相互结合、促进和发展，系统因此能够提供更加协调的人机对话方式。 2）工程应用当前的工程在很大程度上依赖于图形工具，以便直观地显示各种产品，目前，CAD/CAM已经成为机械、建筑等领域必不可少的软件工具。分布式虚拟现实系统的应用将使工程人员能通过全球网或局域网按协作方式进行三维模型的设计、交流和发布，从而进一步提高生产效率并削减成本。第八章多媒体技术基础

3）商业应用对于那些期望与顾客建立直接联系的公司，尤其是那些在他们的主页上向客户发送电子广告的公司，Internet具有特别的吸引力。分布式虚拟系统的应用有可能大幅度改善顾客购买商品的经历。例如，顾客可以访问虚拟世界中的商店，在那里挑选商品，然后通过Internet办理付款手续，商店则及时把商品送到顾客手中。 3）娱乐应用娱乐领域是分布式虚拟现实系统的一个重要应用领域。它能够提供更为逼真的虚拟环境，从而使人们能够享受其中的乐趣，带来更好的娱乐感觉。第八章多媒体技术基础

流媒体随着互联网的普及，利用网络传输声音与视频信号的需求也越来越大。广播电视等媒体上网后，也都希望通过互联网来发布自己的音视频节目。但是，音视频在存储时文件的体积一般都十分庞大。在网络带宽还很有限的情况下，花几十分钟甚至更长的时间等待一个音视频文件的传输，不能不说是一件让人头疼的事。而流媒体技术的出现，在一定程度上使互联网传输音视频难的局面得到改善。第八章多媒体技术基础

1. 流媒体 2. 流媒体数据流的特点 3. 流媒体的传输技术 4. 流媒体的应用领域第八章多媒体技术基础

流媒体流媒体(Streaming Media)指在数据网络上按时间先后次序传输和播放的连续音/视频数据流。以前人们在网络上看电影或听音乐时，必须先将整个影音文件下载并存储在本地计算机上，然后才可以观看。与传统的播放方式不同，流媒体在播放前并不下载整个文件，只将部分内容缓存，使流媒体数据流边传送边播放，这样就节省了下载等待时间和存储空间。流媒体技术将过去传统媒体的“推”式传播，变为受众的“拉” 式传播，受众不再是被动地接受来自广播电视的节目，而是在自己方便的时间来接收自己需要的信息。这将在一定程度上提高受众的地位，使他们在新闻传播中占有主动权，也使他们的需求对新闻媒体的活动产生更为直接的影响。第八章多媒体技术基础

流媒体数据流的特点流媒体数据流具有三个特点：连续性（Continuous）、实时性（Real-time）、时序性，即其数据流具有严格的前后时序关系。第八章多媒体技术基础

流媒体的传输技术流媒体的传输技术分为两种，一种是顺序流式传输，另一种是实时流式传输。顺序流式传输就是顺序下载，在下载文件的同时用户可以观看。但用户的观看与服务器上的传输并不是同步进行的，用户是在一段延时后才能看到服务器上传出来的信息，或者说用户看到的总是服务器在若干时间以前传过来的信息。在这过程中，用户只能观看已下载的那部分，而不能要求跳到还未下载的部分。顺序流式传输比较适合高质量的短片段，因为它可以较好地保证节目播放的最终质量。它适合于在网站上发布的供用户点播的音视频节目。在实时流式传输中，音视频信息可被实时观看到。在观看过程中，用户可快进或后退以观看前面或后面的内容，但是在这种传输方式中，如果网络传输状况不理想，则收到的信号效果比较差。第八章多媒体技术基础

流媒体的应用领域目前基于流媒体的应用非常多，发展非常快。流媒体的应用主要有：视频点播(VOD)、视频广播、视频监视、视频会议、远程教学、交互式游戏等。丰富的流媒体应用对用户有很强的吸引力，在解决了制约流媒体的关键技术问题后，可以预料，流媒体应用必然会成为未来网络的主流应用。第八章多媒体技术基础

8.4 多媒体技术的应用领域多媒体技术为计算机的应用开拓了更广阔的领域，对人类的工作、家庭生活以及社会活动产生了极大的影响。多媒体技术的应用主要有以下几个方面。第八章多媒体技术基础

1. 教育与培训 2.电子出版 3. 商业广告 4. 影视娱乐业 5. 医疗 6. 旅游 7. 人工智能模拟第八章多媒体技术基础

教育与培训多媒体技术为丰富多彩的教学方式增添了一种新的手段。多媒体技术可以将课文、图表、声音、动画、影片和录像等组合在一起构成教育产品，这种图、文、声、像并茂的场景极大地丰富了教学内容，使学生获得了生动的学习环境，有助于学习效率的提高——学得懂、记得住、效率高、理解快。用于军事、体育、医学、驾驶等方面的多媒体计算机，不仅可以使受训者在生动、直观、逼真的场景中完成训练过程，而且能够设置各种复杂环境，提高受训人员对环境和突发事件的应对能力，并能自动评测学员的学习成绩。第八章多媒体技术基础

电子出版电子出版物是指以数字代码方式将图、文、声、像等信息存储在磁、光、电介质上，通过计算机或类似设备阅读使用，并可复制发行的大众传播媒体。电子出版物信息容量大，体积小，成本低，除了文字图表外还可以配以声音解说、背景音乐和视频图像，形式生动活泼，易于检索和保存，具有广阔的应用和发展前景。第八章多媒体技术基础

商业广告企业利用多媒体技术宣传其产品和服务信息，可以使人们有更多的感性认识，取得较好的宣传效果。第八章多媒体技术基础

影视娱乐业利用多媒体技术制作电影特技、变形效果、MTV特技、三维成像模拟特技、仿真游戏、赌博游戏。第八章多媒体技术基础

医疗在医学界可以利用网络多媒体技术进行网络远程诊断、网络远程操作（手术），可使医生远在千里之外就可以为患者看病开处方。对于疑难病例，各路专家还可以联合会诊，这样不仅为危重病人赢得了宝贵的时间，同时也使专家们节约了大量的时间。第八章多媒体技术基础

旅游利用多媒体技术可以在旅游景点的介绍上实现景点风光重现，实现风土人情介绍和服务项目介绍等。第八章多媒体技术基础

人工智能模拟利用多媒体技术，可以对生物形态、生物智能和人类行为智能进行模拟，实现单纯通过人为想象不可能达到的效果。第八章多媒体技术基础

谢谢使用！第八章多媒体技术基础

第八章多媒体技术基础.

Similar presentations

Presentation on theme: "第八章多媒体技术基础."— Presentation transcript:

Similar presentations

About project

反馈

请登录

Auth with social network:

第八章 多媒体技术基础.

Similar presentations

Presentation on theme: "第八章 多媒体技术基础."— Presentation transcript:

Similar presentations

About project

反馈

第八章多媒体技术基础.

Presentation on theme: "第八章多媒体技术基础."— Presentation transcript: