第七章 多媒体技术 7.1 多媒体技术概述 7.2 多媒体计算机组成 7.3 数字图像基础 7.4 视频信息处理基础 7.5 网络传输多媒体信息
7.1多媒体概述 媒体(media)—信息的载体 计算机领域中的有两种含义: 一、指用于存储信息的物理实体,如磁盘、光盘 通常意义上的媒体:如报纸、电视、杂志、广播等 计算机领域中的有两种含义: 一、指用于存储信息的物理实体,如磁盘、光盘 二、指信息的表现形式或载体,如文字(Text)、声音(Audio)、图形(Graphic)、图像(Image)、动画(Flash)、视频(Video)
1.什么是多媒体 多媒体(Multimedia )就是文字、图形、图像、声音、动画、视频等多种媒体信息的集合。 多媒体技术是指利用计算机技术(且综合了声音处理技术、图形图像处理技术、视频处理技术、数据存储等技术)将各种媒体以数字化的方式集成在一起,并能够对它们进行加工处理的技术。 加工处理指媒体录入、压缩与解压缩、存储、显示、 传输。
2.多媒体技术及其特点 多媒体的主要特性: 集成性 交互性 实时性 多样化
7.2多媒体计算机系统的组成 多媒体计算机(Multimedia Computer)是具有多媒体处理能力的计算机系统 声/像输入设备主要用于将多媒体信息输入计算机:光驱、声卡、视频采集卡、麦克风、扫描仪、录音机、VCD/DVD、数字照相机、摄像机等。 功能卡用于对多媒体信息进行处理:Modem卡、VCD压缩卡、网卡等。 声/像输出设备用于输出多媒体信息:光盘刻录机、声卡、音箱、立体声耳机、打印机等。
多媒体计算机系统示意图 上一页 下一页 停止放映
7.3 7.3数字图像基础 1.图像的数字化和数字图像 2.图像的颜色模型 3.图像文件格式 4.数字图像处理
1.图像的数字化和数字图像 将真实图像转换成计算机能表示的形式(二进制等数值组成) 将连续模拟图像转换成离散的数字图像。图像的数字化与声音的数字化的步骤相似。 量化 编码 采样 整量
采样和整量的方法: 如果对连续图像f(x,y)的坐标,按一定顺序进行等间隔的采样,就将图像划分成N ×N个小方块图像,当N很大时,小方块就可以近似看成小圆点;若对每一点的色彩(或灰度)值也用等间隔整数值来表示,即进行整量(量化),那么就可以得到一个N ×N的数组(即N ×N个数据值)。
数字化图示 图像的数字化 空间上和灰度级上都离散的图像称为数字图像 对图像进行采样和灰度级的量化称为图像的数字化。 图像 采样 量化 数字图像 图像的数字化 对图像进行采样和灰度级的量化称为图像的数字化。
数字图像的表示形式一——位图 用记录每一个离散点的颜色的方法(就象前面介绍的采样、量化和编码)来描述图像,这种图像叫位图图像。 一幅彩色图像可以看成由许许多多的点组成的,图像中的单个点称为像素 。像素值即颜色值。 一个像素值往往用R、G、B三个分量表示。R、G、B分别代表红(red)、绿(green)、蓝(blue)。
数字图像的性能指标 图像分辨率 扫描分辨率 显示分辨率 像素深度
图像分辨率 图像采样的点数,称为图像分辨率,或者说组成图像的像素数目。 用点的“行数×列数”表示。 如数码像机常用的图像分辨率为640×480、1024×786等。 对相同尺幅的图像,如果组成该图的像素数目越多,则说明图像的分辨率越高,看起来就越逼真。相反,图像显得越粗糙。 图像分辨率越高,图像文件占用的存储空间越大。
扫描分辨率 用每英寸多少点(dots per inch,DPI)表示。 分辨率越高,像素就越多,获得的图像越细腻。 区别:扫描分辨率是采样时,单位尺寸内采样的点数,而图像分辨率是组成数字图像的像素数。
图像的显示分辨率 数字图像的视觉效果与图像输出设备有关,图像在屏幕上的显 示尺幅称为图像的显示分辨率。 例:一副图像分辨率为320*240的图像,在分辨率为640*480的 VGA显示器上的大小为该屏幕的_____。 A 十六分之一 B 八分之一 C 四分之一 D 以上都不对 分辨率低的图像可以以高的分辨率显示,分辨率高的图像也可 以以低的分辨率显示,但只要不是以图像的正常分辨率显示图 像,都会引起图像的失真。 C
像素深度(Pixel Depth) 数字图像中表示每个像素的颜色使用的二进制位数称为像素深度或位深度。 像素深度值越大,图像能表示颜色数越多,色彩越丰富逼真,占用的存储空间越大。 常见的像素值位数有1位、4位、8位和24位,分别用来表示: 黑白图像 16色或16级灰度图像 256色或256级灰度图像 真彩色(224—16 777 216种颜色)图像。
图象大小:举例 图像文件占用存储空间的多少(一般以字节做单位) 图像的分辨率和像素位深度决定了图像文件的大小。 例: 一幅640×480的图像,位深度是24位(真彩色图像),则文件大小(字节)为: 24(bit)/8(bit/Byte)×640(列)×480(行)=921600(Bytes)约900kB
图像颜色 位图图像按颜色又分为 灰度图像的颜色只有黑白和浓淡之分 只有黑白两种颜色的称为单色图像 灰度图像还有16级、256级灰度 灰度图像(Gray image) 彩色图像(Color image) 灰度图像的颜色只有黑白和浓淡之分 只有黑白两种颜色的称为单色图像 灰度图像还有16级、256级灰度 彩色图像有红、绿、蓝等丰富的色彩,有16色、256色和24位真彩色之分。
黑白图像
灰度图
16色图像
256色图像
24位真彩色图像
不同位深度的图像对比
2.图像的颜色模型 颜色:指视觉器官对各种不同波长的光波 的感觉 用颜色的三个特性来区分颜色,它们是:色调,饱和度和明度。 色调指颜色的外观,用于区别颜色的名称或颜色的种类。是视觉系统对一个区域呈现的颜色的感觉。
饱和度和明度 饱和度是指颜色的纯洁性,它可用来区别颜色明暗的程度 明度是视觉系统对可见物体辐射或者发光明亮度的感知属性 当一种颜色渗入其他光成分愈多时,就说颜色愈不饱和。 完全饱和的颜色是指没有渗入白光所呈现的颜色 明度是视觉系统对可见物体辐射或者发光明亮度的感知属性 国际照明委员会用亮度来代替明度,亮度就像光的强度
取色框
RGB相加混色模型 理论上,任何一种颜色都可用红(Red)、绿(Green)、蓝(Blue)三种基本颜色按不同的比例混合得到,称为相加混色。 在计算机中,将红、绿、蓝三种颜色分别按光强度(深浅)的不同分为256个级别,0级实际上是黑色,255级是纯色(红、绿或蓝),分别用8位二进制数表示,每个像素占24位。 (Windows画图) 其他颜色模型见教材,请自学。
数字图像的表示形式二——矢量图 矢量图像实际是用数学方法描述一幅图。 优点:容易进行移动、缩放、旋转和扭曲等变换;矢量图与分辨率无关,放大不会产生马赛克现象。 缺点:由于计算机实现矢量图要进行大量的计算,故不适合表现复杂的彩色照片。 常用软件:Flash/Fireworks/3DMAX
3.图像文件格式 图像文件格式是图像数据在文件中的存放形式,不同的软硬件厂商可能定义不同的文件格式。 (1)位图文件(Bitmap-File,BMP) 与硬件无关的图像文件格式 有压缩和非压缩之分 文件所占空间大,是Windows环境中交换与图有关的数据的一种标准,所有软件都支持。
在一个GIF文件中可以存多幅彩色图像,逐幅读出可以构成动画。 GIF(Graphics Interchange Format) 压缩率50%左右。 图像经过压缩,图像深度1-8位(最多显示256色),适合存储颜色较少的卡通图像、徽标等手绘图像 。 支持透明图像属性和动画图像属性。 在一个GIF文件中可以存多幅彩色图像,逐幅读出可以构成动画。
GIF格式的特性 GIF动画 背景透明 背景不透明
JPEG(Joint Photographic Experts Group)负责制定静态的数字图像数据压缩编码标准 相应的文件存储格式为jpg格式 有损压缩去除冗余图像数据,能以很高的压缩比率来保存图像而图像依然生动, 适合存储色彩丰富的照片
(5)PSD格式(photoshop document) (4)WMF格式(windows metafile format) 是一种矢量图形格式,在Windows中很多程序支持,如MS office的剪辑库中有很多WMF格式图像,但Windows以外的程序支持少。 (5)PSD格式(photoshop document) 是Photoshop的专用文件格式,含有图层、通道、蒙版和色彩模型等多种图像编辑信息,是一种非压缩的原始文件保存格式。容量大,便于修改。 (6)PNG格式(portable network graphics) 网上常见,尺寸比GIF小30%的无损压缩图像文件。同时提供24位和48位真彩色图像支持, Photoshop可处理,亦可保存为该格式。
数字图像数据压缩 无损压缩:可删除一些重复数据,大大减少要在存储介质(如硬盘)上保存的图像尺寸,但并不能减少图像的内存占用量,因从存储介质上读取图像时,软件会把丢失的信息填充进来。还原后的图像与压缩前一样。 优点:比较好地保存图像的质量 缺点:压缩率比较低。 无损压缩的例子—RLE(run-length encoding,游程长度编码) 一种无损压缩的方式(Microsoft RLE仅仅支持256色),编码原理是用两个数替代图像文件中表示像素值的数字重复的序列:一个数指定了游程的长度(像素值重复的数目),另一个数表示像素值本身。 这是一种非常通用、简单的无损压缩方法,包括BMP的许多图像文件使用了该方法。一个图形程序通过读取压缩文件并展开重复游程,使之恢复合适的像素值来给图像解压缩,这样,压缩后得到的图像与原图完全相同。
数字图像数据压缩 有损压缩:通过对源文件进行数学分析,寻找需要保存的信息,会丢失一些数据。无法将图像还原到与压缩前完全一样的状态的压缩方法。 有损压缩的例子—将图像压缩为JEPG格式的文件 原理:根据重要等级分离图像中的信息,然后为了减少存储的全部数据量,去掉一些不太重要的信息。 JPEG有损压缩允许用户指定质量因子。高质量因子保留更多的图像细节,但是产生了较低的压缩率;低质量因子产生了较高的压缩率,但是图像较模糊。 JPEG丢弃了图像中的高频成分,保留了低频成分,图像解压缩时,结果像素值不一定与原来一样,但人的眼睛对于颜色中的高频成分变化不太敏感,对图像的注意力会停留在低频成分上,所以感觉差异不大。
4.数字图像的处理 数字图像的获取 数字图像的处理 图像数字化的手段:扫描、数字摄影等 扫描仪:最常用,根据外形和产生图像方式分为手持式、平板式。 数码相机:将所拍摄的画面以数字形式保存在内部存储器中,然后通过计算机的通信口将数据传送到硬盘上。 数字图像的处理 主要操作:图像颜色模式变换;部分图像选取;大小缩放、剪切、翻转、旋转、扭曲;多幅图像的编辑、合成;添加马赛克、模糊、玻璃化、水印等特殊效果;图像文件格式转换和打印输出。 常用软件:Photoshop
7.4视频信息处理基础 7.4 视频(video)是由一幅幅单独的画面序列组成的,每一幅画面称为一帧,当达到12fps(帧运动速率单位)以上时,人们才能看到比较连贯的视频图像。电影为每秒24张胶片,电视为每秒25帧。通常,伴随视频图像还有一个或多个音频轨道,以提供配套的声音。 视频信息数字化原理 对电视模拟信号数字化:包括采样、量化、模数转换、色彩空间转换等过程。 视频采集的模拟信号源可以是录像机、摄像机、影碟机等,
1. 数字视频文件格式 数字视频格式一般取决于视频的压缩标准。 视频格式一般分为: 影像格式(video format) 流格式(stream video format) AVI系列(知道) 声音/影像交错文件 是指可以将视频和音频交织在一起进行同步播放。是一种Windows系统中比较通用的视频格式。 MOV格式(知道)(movie digital video technology) 优点:可跨平台使用、存储空间要求小。已成为数字媒体软件技术领域事实上的工业标准。 支持25位彩色,支持领先的集成压缩技术。
数字视频文件格式(二) MPEG系列 movie pictures experts group (知道) (1)MPEG格式(知道) 文件扩展名为mpg或mpeg。 在保证影象质量的基础上,采用有损算法减少运动图像中的冗余信息,从而达到高压缩比。 MPEG包括MPEG-1、 MPEG-2和MPEG-4,分别适应不同的带宽和数字影像质量的要求。 MPEG-4适合在网上在线观看。 (2)DAT格式(知道) 是Video CD(VCD)数据文件的扩展名,也是基于MPEG压缩算法,是标准VCD影碟里的视频文件。 该文件一般放在VCD光碟的MPEGAV文件夹里。
数字视频文件格式(三) ASF (知道)advanced streaming format 高级流媒体格式 采用MPEG-4压缩算法,压缩率和图像质量都很不错。 RM(知道)real media 一种流式视频格式。 采用一种“边传边播”的方法,即先从服务器上下载一部分视频文件,形成视频流缓冲区后实时播放,同时继续下载,为接下来的播放做准备。 WMV格式 windows media video(知道) 是微软推出的一种采用独立编码方式并且可以直接在网上实时观看视频节目的流式视频压缩格式。 RMVB格式(知道) 由RM视频格式升级的新视频格式。 播放:使用RealOne Player 2.0/RealPlayer 8.0/RealVideo 9.0
2.视频信息压缩基本原理 图像压缩编码 活动图像的压缩实质上是将数字化的视频信息重新编码成一种数据流,目的是在保持原图像质量的前提下减少需要存储和传送的图像或视频数据。 数据压缩处理包括编码和解码两个部分 编码:将原始数据经过编码进行压缩,以便于存储和传输 解码:对编码数据进行解码,还原为可以使用的数据。 数据压缩方法根据解码后的数据是否与原始数据一致分为:可逆编码(无损压缩)——不可逆编码(有损压缩)
视频信息压缩基本原理 视频信息计算 24位量化的640 ×480分辨率的图像按25fps播放,40秒占多少存储空间? 所以只有采用了MPEG技术进行压缩后才能在一张DVD上存储,最大压缩比 200:1 视频信息计算 24位量化的640 ×480分辨率的图像按25fps播放,40秒占多少存储空间? 24 × 640 ×480 ×25 ×40/8≈0.92GB 计算:一部标准电影为100分钟,采用SVGA的分辨率(800×600). 每秒25帧标准速度。 答案:需要216G=100×60×800×600×25*24/8
动画技术 动画实质是一幅幅静态图像的连续播放。所以其生成的实质是若干幅动画页面的生成。动画的连续播放既包括时间上的连续,更要求动画内容上的连续。 计算机设计动画方法有两种:造型动画和逐帧动画。 按视觉效果分类: 具有平面动态图形效果的二维动画 Flash mx 具有立体效果的三维动画 3DS、3D MAX 、COOL 3D 用于虚拟现实的真实模拟动画
动画的存储格式 GIF格式 SWF格式 产生原理是一系列具有细微差异的图片连续播放,动画由计算机实现。 软件:Cool 3D、Flash MX SWF格式 Flash动画的文件格式 特点是:占用比较小的存储空间。添加MP3音乐,网络常用。
7.5网络传输多媒体信息 7.5 目前主要通过下载和流式传输两种方式,实现音频、视频等多媒体信息在网络中传播。 采用下载方式时,必须考虑:用户端的存储空间需求和下载延时问题。 流媒体概念:表示声音、影像或动画等媒体,由媒体服务器向用户计算机的连续、实时传送,由于数据发送过程一开始,所传输的媒体几乎可以立即开始播放,从而不存在下载延时问题。 流式传输原理:把连续的影像和声音经过数据压缩处理后放到网络媒体服务器中,让用户可以边下载边收看、收听,不需要等待整个媒体文件下载到自己机器后才可以观看的网络传输技术。
流式传输与HTTP方式传输的区别: 服务器不是一次性发送完所有的媒体文件数据,而是发送第一部分,然后在第一部分开始播放的同时,媒体文件的其余部分在源源不断地传输,及时到达用户计算机中供播放用。 数据从用户的缓冲区里像水一样流过,不在用户的计算机中留下任何内容。 服务器 播放器 streaming downloading 流式传送 用HTTP方式传送