计 算 机 应 用 基 础 潍坊学院 计算机工程学院 主讲人 王鑫
上讲内容回顾 数据管理技术; 常用的数据库管理系统; 数据库应用。 数据库 数据仓库 数据挖掘 Access、Visual FoxPro、SQL Server; 数据库应用。
本讲内容 多媒体世界 多媒体中的基本概念 多媒体技术 第14讲 多媒体(1) 本讲内容 多媒体世界 多媒体中的基本概念 多媒体技术 教学重点:媒体的类型、多媒体技术。 教学难点:音频技术、图像技术。
8.1多媒体世界 8.1.1 多媒体的发展过程 8.1.2 多媒体的未来
8.1.1 多媒体的发展过程 发 展 过 程 未 来 12英寸的CGA/EGA屏幕,图形处理能力。 PC喇叭,具有声音处理能力 第四代计算机成为 多媒体技术发展的动力 发 展 过 程 1987年8月, 创新音乐系统问世 12复音立体声音乐合成卡。标志着电脑具备了音频处理能力,电脑进入多媒体技术发展阶段 1988年MPEG的建立 对多媒体技术的发展起到了推进作用 WAV、MIDI以单机为主 多种网络音乐压缩技术 音频处理技术 视频处理技术 90年代,自80486以后多媒体时代到来。 AVI为视频存储奠定基础、 Stream传播视频变得轻松 MPEP普及了视频应用 未 来 21世纪向着网络和计算机技术相交融的交互式多媒体将成为多媒体发展方向。包括:大容量光碟存储器、国际互联网和交互电视。
8.1.1 多媒体的未来 交互式多媒体 网络和计算机技术相交融的交互式多媒体将成为21世纪多媒体发展方向。所谓交互式多媒体是指不仅可以从网络上接受信息、选择信息,还可以发送信息,其信息以多媒体的形式传输。利用这一技术,人们能够在家里购物、点播自己喜欢的电视节目。21世纪的交互式多媒体技术的实现将以电视或者以个人计算机为基础。 技术综合性 多媒体正在迅速的、以意想不到的方式进入人们生活的多个方面,大的趋势是各个方面都将朝着当今新技术综合的方向发展,它不仅影响信息的包装方式和信息的使用方式,而且将改变我们互相通信的方式。例如:电信网、广播电视网和互联网的融合,将迅速扩展语音、数据、图像等综合多媒体的通信业务;高清视频应用将从会议室走向民间,成为大众产品;3D技术将会在影视产品生产领域大显身手,甚至会彻底改变当前的影视产品的制作模式;物联网将由概念模式走向应用,并会以惊人的速度迅速发展。
8.2.1 媒体及其五种形式 8.2.2 多媒体信息类型 8.2.3 超文本与超媒体 8.2 多媒体中的基本概念 8.2.1 媒体及其五种形式 8.2.2 多媒体信息类型 8.2.3 超文本与超媒体
媒体是信息存储、表示和传播的载体。 国际电话电报咨询委员会把媒体分成五类: 感觉媒体 表示媒体 表现媒体 存储媒体 传输媒体 8.2.1 媒体及其五种形式 媒体是信息存储、表示和传播的载体。 国际电话电报咨询委员会把媒体分成五类: 感觉媒体 表示媒体 表现媒体 存储媒体 传输媒体
8.2.1 媒体及其五种形式 1. 感觉媒体(Perception Medium):指直接作用于人的感觉器官,使人产生直接感觉的媒体。如引起听觉反应的声音,引起视觉反应的图像等。 2. 表示媒体(Representation Medium):指传输感觉媒体的中介媒体,即用于数据交换的编码。如图像编码、文本编码和声音编码等。这是为了加工、处理和传输感觉媒体而人为地研究、构造出来的一类媒体。 3. 表现媒体(Presentation Medium):指进行信息输入和输出的媒体。如键盘、鼠标、扫描仪、话筒、摄像机等为输入媒体;显示器、打印机、喇叭等为输出媒体。 4. 存储媒体(Storage Medium):指用于存储表示媒体的物理介质。如硬盘、软盘、磁盘、光盘、ROM及RAM等。 5. 传输媒体(Transmission Medium):指传输表示媒体的物理介质。如双绞线、同轴电缆和光缆等。
8.2.2 多媒体信息类型 文本 图像 信息类型 动画 声音 视频影像 8.2.2 多媒体信息类型 多媒体(Multimedia):由单媒体复合而成的,是融合两种以上媒体的人机交互式信息交流和传播的媒体。 使用最多,用文字和各种专用符号表达的信息形式,主要对知识的描述性表示。(离散媒体:与时间无关、无周期变化) 文本 信息类型 图像 最重要,决定多媒体软件视觉效果的关键因素 使抽象内容形象化。 如画面的缩放、旋转、变换、淡入淡出等特殊效果。文件格式有FLC、MMM、GIF、SWF等。 动画 传递信息、交流感情最方便、最熟悉的方式之一,分为音乐和音效两类。 声音 视频影像 具有时序性与丰富的信息内涵,常用于交待事物的发展过程,有声有色,存储格式有AVI、MPG、MOV等。
8.2.3 超文本与超媒体 超文本与超媒体技术:模仿人脑的联想记忆方式,把一些信息块按需要用一定的逻辑顺序链接成非线性网状结构的信息管理技术。 超文本 建立文、句之间的链接 由信息节点和表示信息节点间相关性的链组成的具有一定逻辑结构和语义的网络。 超媒体 建立的是多媒体之间的链接关系
8.3.1 多媒体技术的特点 8.3.2 音频信息处理技术 8.3.3 图像信息处理技术 8.3.4 视频信息处理技术 8.3 多媒体技术 8.3.1 多媒体技术的特点 8.3.2 音频信息处理技术 8.3.3 图像信息处理技术 8.3.4 视频信息处理技术
8.3.1 多媒体技术的特点 信息媒体的多样性 多样性 信息媒体的处理方式多样性(多维化) 多媒体设备与设施的多样性 信息媒体的集成 集成性 8.3.1 多媒体技术的特点 信息媒体的多样性 信息媒体的处理方式多样性(多维化) 多媒体设备与设施的多样性 多样性 集成性 交互性 实时性 信息媒体的集成 多媒体设备与软件的集成 关键特性。指通过各种媒体信息,参与的各方都可以对有关信息进行编辑、控制和传递。 声音和视频与时间因子密切相关,多媒体技术必然要支持实时处理,接收到的各种信息媒体在时间上必须是同步的。要求多媒体系统在处理信息时有着严格的时序要求和很高的速度要求。
支持多媒体信息处理的基础技术 大规模集成电路 大容量的存储技术 和各种媒体压缩技术 网络与通信技术 各种媒体技术标准 的制定和完善 使计算机的运算速度及内存容量大幅度提高,为多媒体信息的实时处理创造了条件 为多媒体信息的存储和传输提供了保证 使多媒体通信对网络总带宽的要求得到一定程度的满足 推动了多媒体技术的发展
多媒体信息处理的关键技术 计算机系统技术 数据压缩和编码技术 数据存储技术 同步技术 数据管理和检索技术 多媒体网络技术 由于多媒体信息量大、处理方式复杂多样、实时性强等特点,多媒体计算机系统对运算速度、存储容量和信息传输速率均有很高的要求。 VLSI使CPU速度更快、数字信号处理器DSP价更低。 在硬件配置方面,一般使用高速总线的主板,配有较大的内存和外存(硬盘),并使用高速串行总线USB 2.0和IEEE 1394连接各种标准配置的外部设备。 多媒体操作系统是多媒体应用软件的支撑环境,主要解决两个问题:一是保证实时性,二是满足MPC各种功能的要求。OS还提供了丰富的制作多媒体节目的工具软件和多媒体著作工具软件。 是最为关键的核心技术。声音、图像和视频信息数字化后,其信息量很大,需要很大的空间和传输时间,要进行压缩编码存储和传输,当用到时才解压还原。 计算机系统技术 数据压缩和编码技术 数据存储技术 同步技术 数据管理和检索技术 多媒体网络技术 数字化的多媒体信息虽然经过了压缩处理,但仍然包含大量的数据。 数字化数据存储可采用的介质有硬盘(固定、移动)、磁带、光盘(CD-ROM650MB,DVD(单面4.7GB,双层结构17GB) 在多媒体技术的应用中,各种媒体信息都与时间和空间存在着或多或少的依从关系。因此多媒体的集成、转换和传递会受到时空同步的制约。 是多媒体技术和网络技术相结合的综合技术。通过宽带高速网络系统将多个独立的多媒体计算机连接成为局域网,或者是跨地域的广域网,实现多媒体通信和多媒体信息资源的共享。 多媒体网络技术主要解决网络吞吐量、传输可靠性、传输实时性和服务质量等问题。 传统是基于关键字检索方法。目前比较先进的是基于内容的多媒体检索技术,特点是: ① 根据媒体对象的语义和上下文联系进行检索。对媒体分析,提取特征。 ② 人机交互。人可分辨查找内容,计算机可记住信息。 ③ 基于内容的检索是一种近似的匹配,逐步求精
多媒体的研究与发展技术 包括文字、声音、图形、图像、动画、影视等媒体在计算机中的表示方法。数据量大,要研究: (1)数据压缩与解压技术 (2)人—机接口技术,如语音识别和文本—语音转换(简称TTS)也是多媒体研究中的重要课题; (3)虚拟现实(简称VR)是当今多媒体技术研究中的热点技术之一。 存储目标是:实现大容量信息的存储和管理。在发展集中式的海量存储技术的同时,也在向分布存储、并行访问的方向发展。分布数据存储技术与多媒体存储技术将在计算机通信网络中融合起来。 多媒体数据的表示技术 包括多媒体CD-ROM节目(title)制作、多媒体数据库、环球超媒体信息系统(Web)、多目标广播技术、影视点播(简称VOD)、电视会议、远程教育系统、多媒体信息的检索等。 多媒体数据的存储技术 基本目标是功能强大、适应性强、使用方便等,为将来人人都会使用多媒体创作和编辑工具提供条件。 多媒体的应用开发 多媒体创作和编辑工具的研究开发
8.3.2 音频信息处理技术 声音是多媒体信息的重要组成部分,音频信息处理技术的发展极大地促进了多媒体技术的推广应用。声音的采样和量化、音频信息的压缩和编码、音频文件格式等是音频信息处理技术的基本内容。
8.3.2 音频信息处理技术 1. 声音的采样和量化 声音为模拟信号,要在计算机中实现声音的处理,就要首先将其转化为数字信号,转化方法是对模拟信号进行采样和量化。经过采样和量化后,以数字形式保存起来。 声音模拟信号波形图 采样量化示意图
8.3.2 音频信息处理技术 为了声音的保真,就要有更高的采样频率和更高的量化精度。量化精度越高,声音样本的位数越多;采样频率越高,单位时间内产生的数据个量就越大。 一般情况下,采样量化后生成的音频文件会比较大,在多媒体系统中存储和传输时需要对其进行压缩,在尽量保真的情况下减小文件的大小,以提高处理和传输效率。 音频信号的处理过程
决定数字波形质量和容量的因素 根据采样定理,40 kHz的采样频率就可以获得满意的质量。所以,在多媒体标准中,标准的声音采样频率有11.025 kHz、22.050 kHz和44.100 kHz等。 采样频率 量化位数 声道数 采样量化位数反映了对采样点数据进行数字化时的精度。若对采样值量化时采用n位(即n bit)采样,则其量化的精度就有2n个等级。声音的量化一般是8位、16位或32位,相应的声卡也常被称为8位声卡、16位声卡、32位声卡等。 声道数表明记录声音的波形个数,只记录一个声音波形称为单声道;记录两个波形称为双声道,即立体声。记录声音所需的存储空间由下面的公式决定: 记录每秒声音所需的字节数=(采样频率×采样量化位数×声道数)/8
8.3.2 音频信息处理技术 2.音频压缩技术和编码标准 8.3.2 音频信息处理技术 2.音频压缩技术和编码标准 音频压缩技术指的是对原始数字音频信号流(PCM编码)运用适当的数字信号处理技术,在不损失有用信息量,或所引入损失可忽略的条件下,降低编码量。压缩编码必须具有相应的逆变换,称为解压缩或解码。 广泛应用的音频压缩标准:MPEG-1、MPEG-2等。
8.3.2 音频信息处理技术 3. 常用的音频文件 (1) PCM格式:广泛用于CD音乐中,对音源无损伤,通常被用来储存声音素材。 8.3.2 音频信息处理技术 3. 常用的音频文件 (1) PCM格式:广泛用于CD音乐中,对音源无损伤,通常被用来储存声音素材。 (2) WAV格式:微软公司开发的一种声音文件格式,几乎所有的音频编辑软件都支持WAV格式,缺点是文件大。 (3) MP3格式:目前最流行的音频格式,也是最为广泛的网络流媒体格式。文件小、音质好,是一种主流音频格式。 (4) WMA格式。微软公司开发文件格式,它常用的网络流媒体格式。在同音质的情况下文件仅为MP3文件的1/2,是源文件的1/24。 (5) MID格式。MID文件格式用于存储MIDI音乐信息。
8.3.2 图像信息处理技术 多媒体图像信息处理是一个复杂的过程,要经过采集、编码、压缩、存储、分析处理、显示等多个环节。 8.3.2 图像信息处理技术 多媒体图像信息处理是一个复杂的过程,要经过采集、编码、压缩、存储、分析处理、显示等多个环节。 本节仅对 图像采集、编码和压缩原理、图像编码标准、常用图像文件等知识作简要介绍。
图像信息的处理过程
8.3.2 图像信息处理技术 1. 采集 图像的采集要经过采样和量化,把图像在水平和垂直方向分解成许多的点,记录下每个点的颜色值,分解成红、绿、蓝三种基色的组合存储起来。 采集图像的设备有多种,扫描仪、数码相机等都是常用的设备,摄像机(或数字摄像机)采集的视频图像也是重要的图像来源。 黑白图像量化时保存的是像素点的灰度(亮度)值,如量化成256个灰度级,保存时就要占8位空间(1个字节);彩色图像量化时保存的是像素点中三种基色的亮度值,如每个基色亮度值量化成256个灰度级,三种颜色就要占用24位,即3个字节。
矢量图是用一系列计算机指令来表示一幅图,如画点、画线,画曲线、画圆、画矩形等等。这种方法实际上是用数学方法来描述一幅图,然后变成许许多多的数学表达式,再编程,用语言来表达。矢量图有许多优点。例如,当需要管理每一小块图像时,矢量图法非常有效;目标图像的移动、缩小放大、旋转、复制、属性的改变(如线条变宽变细、颜色的改变)也很容易做到;相同的或类似的图可以把它们当作图的构造块,并把它们存到图库中,这样不仅可以加速画的生成,而且可以减小矢量图文件的大小。有些图像是人工制作的,这要借助于绘图工具,在计算机上绘制,完成后再以点阵或矢量形式保存起来。
8.3.2 图像信息处理技术 2. 编码和压缩 图像数字化之后的数据量非常大,要占用非常多的存储空间,传输时也要占用非常多的时间,因此,对图像进行编码和压缩就显得很重要。 图像数据压缩主要是根据下面两个基本事实来实现的:一个是图像数据中有许多重复的数据,使用数学方法来表示这些重复数据就可以减少数据量;另一个是人的眼睛对图像细节和颜色的辨认有一个极限,把超过极限的部分去掉,也就达到了压缩数据的目的。利用前一个事实的压缩技术是无损压缩技术,利用后一个事实的压缩技术是有损压缩技术。实际的图像压缩是综合使用各种有损和无损压缩技术来实现的。
8.3.2 图像信息处理技术 3. 图像压缩标准 1)MPEG-1:为工业级标准而设计,适用于不同带宽的设备。 8.3.2 图像信息处理技术 3. 图像压缩标准 1)MPEG-1:为工业级标准而设计,适用于不同带宽的设备。 2)MPEG-2:设计目标是高级工业标准的图象质量以及更高的传输率。MPEG-2除了做为DVD的指定标准外,还用于为广播、有线电视网、电缆网络以及卫星直播提供广播级的数字视频。 3)MPEG-4:MPEG-4标准主要应用于视频电话、视频电子邮件和电子新闻等。 4)JPEG/ JPEG2000:JPEG是专用于静态图形的压缩标准,它用有损压缩方式去除冗余的图像数据。JPEG格式是目前网络上最流行的图像格式,文件压缩率高。
8.3.2 图像信息处理技术 4. 常用的图像文件 1)BMP格式:包含的图像信息较丰富,几乎不进行压缩,占用较大的磁盘空间。 8.3.2 图像信息处理技术 4. 常用的图像文件 1)BMP格式:包含的图像信息较丰富,几乎不进行压缩,占用较大的磁盘空间。 2)GIF格式:压缩比高,文件小,缺点是不能存储超过256色的图像。 3)JPEG格式:灵活,允许使用不同的压缩比例对图像文件进行压缩,文件较小,下载速度快,是网络上最受欢迎的图像格式。 4)JPEG2000格式:其压缩率比JPEG高约30%左右,JPEG2000 同时支持有损和无损压缩。 5)TIFF格式:图像格式复杂、存贮信息多,有利于原稿的复制。 6)PSD格式:Photoshop的专用格式。
8.3.2 图像信息处理技术 4. 常用的图像文件 7)PNG格式:图像保真好,它吸收了GIF和JPG二者的优点,存贮形式丰富,兼有GIF和JPG的色彩模式。它的另一个特点是能把图像文件压缩到极限以利于网络传输,但又能保留所有与图像品质有关的信息,PNG采用无损压缩方式来压缩文件。 8)SWF格式:Flash动画格式,基于矢量技术,无级缩放不失真,在网页动画和网页图片设计中广泛应用。 9)SVG格式:是一种开放标准的矢量图形语言,可以直接用代码来描绘图像,可以用任何文字处理工具打开SVG图像,通过改变部分代码来使图像具有互交功能,并可以随时插入到HTML中通过浏览器观看浏览。
8.3.4 视频信息处理技术 1. 视频信号处理过程 2. 视频数据的编码和压缩 8.3.4 视频信息处理技术 1. 视频信号处理过程 2. 视频数据的编码和压缩 视频数据的编码和压缩是以声音与图像编码和压缩为基础的,主要采用的是MPEG系列标准。 3. 视频图像的编辑处理 视频图像的编辑处理主要包括视频内容和视频效果的编辑处理与视频内容的分析两个方面。这些处理基本上都要在计算机上完成,其处理的实质是对图像点阵数据的运算。 4. 视频文件类型 MPEG、DAT、MOV、AVI、RM、RA、RAM、ASF等。
本讲小结 (1) 多媒体技术是以计算机为核心,通过多种技术和手段综合处理和应用文字、图像、声音、动画、视频等多媒体信息的集成技术。 (2) 本章主要介绍了多媒体的基本概念、多媒体技术的特点、多媒体技术的基本理论。 (3) 介绍了大量的多媒体文件类型和多媒体技术标准,希望读者在学习时注意区别和理解。
资源扩展 超文本: http://jefferson.village.virginia.edu/elab/elab.html 多媒体 http://www.bookwire.com/PW/directory 多媒体技术 Ralf Steinmetz和Klara Nahrstedt合著的《多媒体技术:计算、通信和应用》