Presentation is loading. Please wait.

Presentation is loading. Please wait.

目标 学完本课程后,您将能够: 企业通信发展历程; 了解VOIP概念; 区分VOIP与PSTN区别; 了解VOIP关键技术;

Similar presentations


Presentation on theme: "目标 学完本课程后,您将能够: 企业通信发展历程; 了解VOIP概念; 区分VOIP与PSTN区别; 了解VOIP关键技术;"— Presentation transcript:

0 统一通信基础 VOIP 推荐书籍:VoIP技术与应用[专著]=Garrier Grade Voice Over IP/(美)Daniel Collins 著;舒华英,李勇 等译

1 目标 学完本课程后,您将能够: 企业通信发展历程; 了解VOIP概念; 区分VOIP与PSTN区别; 了解VOIP关键技术;

2 目录 企业通信发展简介 1.1 发展历程 1.2 传统通信 1.2 融合通信 1.3 统一通信 1.4 智能通信 VoIP 信令与语音知识

3 1.1 发展历程 智能通信 统一通信 融合通信 传统通信 企业通信发展历程 传统通信 语音与数据网络完全割裂。
语音网络是基于传统的TDM技术。 数据网络实现企业内部与各分支机构的互联和信息化接入。 融合通信 IP网络建设已具备一定的基础,可提供相对有保障的VoIP质量。 长途旁路是VoIP在该阶段最典型的应用。 统一通信 用户不受所处地点、时间、所使用终端类型、运营商商网络条件、信息媒介类型 等条件限制,都可以实现实时和有效的沟通。 包括语音通信业务和消息类通信业务这两大类通信方式的统一和融合。 智能通信 统一通信技术与业务运作流程的结合,实现企业内部业务运作流程的智能化和自 动化。 智能通信的核心是开放架构的通信平台,即通信系统向各异构业务系统开放各种 标准化接口。 企业通信发展历程

4 1.2 传统通信 在数据网络的发展初期,语音与数据网络完全割离。
语音网络是基于传统的TDM技术。中小企业的语音通信或采用自行部署内部PBX交换机,或由运营商提供Centrex业务。 数据网络实现企业内部与各分支机构的互联和信息化接入。 PBX Centrex 企业A 企业B 传统通信 语音与数据网络完全割离。 语音网络是基于传统的TDM技术。 数据网络实现企业内部与各分支机构的互联和信息化接入。 PSTN固话运行商:中国电信、中国网通、中国铁通。

5 1.3 融合通信 IP网络建设已具备一定的基础,可提供相对有保障的VoIP质量。 长途旁路是VoIP在该阶段最典型的应用。 企业总部
IP Network 企业总部 分支机构A 分支机构B 融合通信 IP网络建设已具备一定的基础,可提供相对有保障的VoIP质量。 长途旁路是VoIP在该阶段最典型的应用。

6 1.4 统一通信 统一通信,是指用户不受所处地点、时间、所使用终端类型、运营商商网络条件、信息媒介类型等等条件限制,都可以实现实时和有效的沟通,实现文字、图像等各种媒介信息流的高效流动。 统一通信 用户不受所处地点、时间、所使用终端类型、运营商商网络条件、信息媒介类型 等条件限制,都可以实现实时和有效的沟通。 包括语音通信业务和消息类通信业务这两大类通信方式的统一和融合。

7 1.5 智能通信 智能通信的实质就是统一通信技术与业务运作流程的结合,实现企业内部业务运作流程的智能化和自动化。 智能通信
统一通信技术与业务运作流程的结合,实现企业内部业务运作流程的智能化和自 动化。 智能通信的核心是开放架构的通信平台,即通信系统向各异构业务系统开放各种 标准化接口。

8 目录 企业通信发展简介 VoIP 2.1 VoIP简介 2.2 VoIP与PSTN对比 信令与语音知识

9 2.1 VoIP简介 VoIP概念 VoIP(Voice over Internet Protocol) 是指将模拟的声音讯号经过压缩与封包之后,以数据封包的形式在IP网络的环境进行语音讯号的传输,通俗来说也就是互联网电话、网络电话或者简称IP电话。 基本原理 通过语音的压缩算法对语音数据编码进行压缩处理,然后把这些语音数据按 TCP/IP 标准进行打包,经过 IP 网络把数据包送至接收地,再把这些语音数据包串起来,经过解压处理后,恢复成原来的语音信号,从而达到由互联网传送语音的目的。

10 2.2 VoIP与PSTN对比 PSTN与VOIP组网架构对比 PSTN基于电路交换原理进行工作 VOIP基于分组交换原理进行工作 窄带传输
网关服务器 PSTN基于电路交换原理进行工作 电路交换具备以下特征 任何一次通信两端之间必须独占一条路由(线路、话路)。 占用此路由直到通话结束(或通信终止),此过程中其它通信无法占用。 电路接通之后,交换机的控制电路不再干预数据传输,这样就为用户提供 一条完全透明的信息通路。 VOIP基于分组交换原理进行工作 分组交换采用了报文交换的“存储-转发”方式,把报文截成许多比较短的、被规 格化了的“分组(packet)”进行交换和传输。由于分组长度较短,具有同一的格式 ,便于在交换机中存储和处理时,“分组”进入交换机后只在主存储器中停留很 短的时间,进行排队和处理时,一旦确定了新的路由,就很快输出到下一个交换 机或用户终端,“分组”穿过交换机或网路的时间很短,能够满足绝大多数数据 通信用户对信息传输的实时性要求。 VOIP基于分组交换原理进行工作

11 2.2 VoIP与PSTN对比(续) 性能品种 IP 电 话 传统电话 传输媒体 互联网(Internet) 公众电话网(PSTN)
 传统电话 传输媒体 互联网(Internet) 公众电话网(PSTN) 交换方式 分组交换 电路交换 带宽利用率 使 用 费 话音质量 语音传输的媒介是完全不同的,IP电话的传输媒介为Internet网络,而传统电话为公众 电话交换网。 交换方式也是完全不同的,IP电话运用的是分组交换技术,信息根据IP协议分成一个一 个分组进行传输,每个分组上都有目的地址与分组序号,到目的地后再还原成原来的 信号,而且分组可以沿不同的途径到达目的地,而传统电话用的是电路交换的方式, 它没有IP电话交换的这些功能。 从占用信道或带宽上讲,IP电话有信息才传送,反之不传送,这样,其语音信息不占用 固定信道, 使用压缩技术后, 其话音信息可以压缩到8Kbit/s,而传统电话一般要占用 64Kbit/s的固定信道, 而且只要不挂机,传统电话始终占用这一信道,所以IP电话的带 宽远远低于传统电话。 从费用上讲,IP电话的费用组成是:Internet通信资费+市内电话通话资费+IP电话相 关设备费用,由于Internet资费我国仅每分钟6分6厘,市话费也相当便宜,加上IP电话 所占带宽比较低的原因,所以与传统的国际长途电话费的成本比较相对较低,也有一 些国家或地区对传统的国际长话要加收一定的税金,所以,国际长话费相对较高。 从话音质量上讲,IP电话相对传统电话的语音质量较差,其中有带宽、延迟等因素,尤 其在网络拥塞时,通话质量可能难以保证。

12 目录 企业通信发展简介 VoIP 信令与语音知识 3.1 信令知识 3.2 语音压缩编码技术 3.3 静音压缩技术 3.4 话音丢包补偿技术
3.5 回声抵消技术 3.6 语音传输技术 3.7 语音防抖动技术 3.8 语音质量 3.9 窄带中继 企业通信发展简介 VoIP 信令与语音知识

13 3.1 信令知识 SIP和 H.323用于呼叫控制 SIP ( Session Initiation Protocol ) 是IETF提出的IP电话信令协议。 ITU的H.323 系列建议定义了在无业务质量保证的因特网或其它分组网络上多媒体通信的协议及其规程 SIP SIP,一种应用层协议,可以用UDP或TCP作为其传输协议。 与H.323 不同的是:SIP 是一种基于文本的协议,用SIP规则资源定位语言描述( SIP Uniform Resource Locators),这样易于实现和调试,更重要的是灵活性和扩 展性好。由于SIP 仅作于初始化呼叫,而不是传输媒体数据,因而造成的附加传输 代价也不大。SIP的URLL甚至可以嵌入到web页或其它超文本链路中,用户只需用 鼠标一点即可发出一个呼叫。 与H.323 相比,SIP还有建立呼叫快,支持传送电话号码的特点。 H.323协议簇 H.323 基于分组的多媒体通讯系统 H 分组多媒体通讯系统的呼叫信令协议和媒体分组化 H.245 多媒体通信控制协议 RTP/RTCP:实时传输/控制协议 G系列:音频压缩协议G.711,G.729,G H系列:视频压缩协议H.261,H T系列:数据传输协议T.38,T.120 IP-PBX IAD POTS

14 3.1 信令知识(续) MGCP和H.248用于媒体控制 两种协议的区别
MGCP(Media Gateway Control Protocol)用于软交换和媒体网关或软交换和MGCP终端之间,软交换通过此协议来控制媒体网关/MGCP终端上的媒体/控制流的连接、建立、释放。 H.248也是用于媒体网关控制器(MGC)和媒体网关(MG)之间的一种控制协议。 两种协议的区别 两者非常相似,MGCP可以认为是H.248的先驱,由于出现较早,现在主流厂商的软交换系统都支持MGCP。 MGCP和H.248的区别 H248从MGCP衍生过来,可以支持更多类型的接入技术并支持终端的移动性。 H.248最显著之处在于可以比MGCP所允许的规模更大。 H.248还可以通过增加许多Package的定义来对协议的功能进行扩展,因此, H.248比MGCP更具灵活性,已逐渐取代MGCP发展成为媒体网关控制协议的标 准。

15 3.2语音压缩编码技术 语音编码 常用的语音编解码技术: 对模拟的语音信号进行编码,将模拟信号转化成数字信号。 PCM ADPCM
LD-CELP CS-ACELP MP-MLQ PCM:脉冲编码调制;PSTN的经典语音编码方式;是目前衡量语音质量的标准;8K采 样,带宽64K ADPCM:自适应的差分编码方式;通常适用于带宽有限的情况;语音质量非常接近于 PCM,可以在限制的条件下支持FAX,带宽为32Kbps LD-CELP:低时延码本激励线性预测编码方式;就是通常说的G728;语音质量和 ADPCM差不多,甚至更好;带宽为16Kbps;不支持FAX和modem;625us一帧,需 要10bit的信息(码本索引值) CS-ACELP:共轭结构代数码本线性预测编码;就是我们最常用的G729;语音质量接近 ADPCM;带宽8Kbps,10ms一帧,每帧10个字节; MP-MLQ:多脉冲-最大似然量化器编码,G.723.1带宽为6.3/5.3K,30ms一帧,这是 一个相对比较差的编码方式偏偏被很多人作为VoIP的标准,给入网测试带来了麻烦。

16 3.2 语音编码压缩技术(续) 语音编码分类: 波形编码 参量编码(音源编码) 混合编码
将时域的模拟话音的波形信号经过取样、量化、编码而形成的数字话音信号,波形编译码器虽然可提供高话音的质量,但数据率低于16 kb/s的情况下,在技术上还没有解决音质的问题。 参量编码(音源编码) 基于人类语言的发音机理,找出表征语音特征参量,对特征参量进行编码。 混合编码 混合编译码是结合波形编译码和参量编译码之间的优点。

17 3.2 语音编码压缩技术(续) 常用编解码算法有G.711、G.723.1、G.726、G.728、G.729。
调制技术 理想的MOS值 净带宽Kbps 语音质量 G.711 PCM 4.1 64 A G.726 ADPCM 3.85 32 B G.723.1 CELP 3.65 5.3/6.3 G.728 LD-CELP 3.61 16 G.729 CS-ACELP 3.92 8 G.729 常用的包含以下几个标准:G729、G729A、G729B; G729是8kbps的一种低速率编解码 G729A是G729的一个附录,针对G729算法的复杂度,进行简化。 G729B是 针对G729的静音检测技术的一个补充说明。 G729的帧数,每帧时长是10ms,TMG缺省支持20ms,30ms,160ms; TMG的VSU修改代码后,可支持10ms,即每个包包含1帧。 G729的净荷长度,每帧是10个字节=8kbps*10ms/8 推荐使用的打包时长,20ms,占用带宽34.4kbps(未使用静音检测技术)。 常用G729A 8kbps 20ms打包。 RTP的净荷类型值是18。 G.723.1 G.723.1是目前已知的压缩编解码中速率最低的一种算法,分为5.3kbps和 6.3kbps两种。 TMG缺省发送是6.3kbs,在IPP-CH表中可以修改为5.3kbps,6.3k语音质量由于 5.3k。 G.723.1每帧长度是30ms,5.3kbps 30ms净荷长度为20个字节,6.3kbps则是24 个字节;5.3kbps 30ms占用带宽22.9kbps,6.3kbps 30ms占用带宽23.9bps。 常用G kbps 30ms打包。 RTP的净荷类型值是4。 G.726 G726语音质量介于G711和G729之间,是语音质量和节省带宽的折中选择。 TMG支持G726 32kbps 20ms 打包; G726 32kbps 20ms打包,净荷长度是32*20/8 = 80个字节,占用带宽58.4kpbs 。 常用G726 32kbps 20ms打包。 RTP的净荷类型值是2。

18 3.3 静音压缩技术 静音压缩,即在不说话时不发包,从而节省大量网络带宽。 实现静音压缩有两个关键技术:
VAD(静音检测):判断话音信号能量,当低于一定门限时就认为时静默状态。 CNG(舒适噪音生成):静默状态不发包导致通话中听者会因为听不到对方任何动静而感到不舒服,甚至认为对方已经挂机。CNG就是在对方不说话的时候,给听者采用某种方式重构舒适的背景音。 Hi, Jack, this is Sarah. Hi, Sarah. How are you? Slience 一次通话中,说话的时间和听对方说话的时间大体上各占50%,即使说话也有停顿间隙约10%,这样话音活动度大约只有40%。 实现VAD有两个技术难点:1、如何在噪音大的环境下检测静音。2、剪音问题,从静 默到说话之间,需要一段时间和门限来判断,此时开始说话的微弱话音就会被丢弃, 这个时候静默和话音突发之间需要一个平滑过渡。 VAD如果检测到话音,则以正常的编码发送出去;如果检测到静音,则通过SID(静音 指示)通知对方,或者干脆不发包。CNG根据SID来重构舒适的背景音的时候,必须保 持解码器和编码器之间的同步,有音段和无音段的平滑过渡。

19 3.4 话音丢包补偿技术 VoIP是在IP网络上使用UDP进行语音数据的传输,由于网络拥塞、缓冲区溢出、误码等原因,丢包的情况在无连接的IP网络中时常发生。 为避免包丢失带来的影响,采用丢包补偿算法,根据前后语音信息的相关性,在解码时重构出丢失的帧,较好地保证接收语音的音质效果。 在G711等采样编码中,打包时长为20ms,这时候如果网络状况不是很差,不出现大量 连续丢包的情况,对话音质量的影响不是很大。 对于参数编码,由于都是采用线性预测的编码方式,可以通过内差的方法得到丢包分 组的近似估计值。但是连续丢包两个以上的话,将比较难恢复。 IP网络模型的研究表明,如果连续丢包超过2个的话,此时网络连接状态很差,将有一 大堆分组丢失,此时就无能为力了。

20 3.5回声抵消技术 EC的全称为“Echo Canceller”,即“回波消除器”。
在通话过程中,由于设备的原因,讲话方的语音通过某种途径又返回到讲话方的听筒中。这种返回的声音就叫做“回波”,回波会使讲话方感到不适,影响通话质量,所以,应当尽可能的消除回波。 回声表示说话者的声音,经过网络设备后,环回到了自己。 回声的特点是:影响说话者感受的质量,听的一方,不受影响;对于纯IP电话系统来说 ,由于话音信号的接收和发送经由不同的物理线路,也就是所谓的四线制,因此不存 在回音的问题。如果IP网和PSTN互连,通信双方至少有一方是二线制电话,涉及有线 圈的2/4线转换电路,就会产生回音。 回声能为人感觉出来需要两个条件: 强度:要有信号反馈回来(泄漏、声波反射),达到一定的幅度; 时延:要有足够延时时间,ITU-T G.131和ITU-T G.161指出,当回波延时超过 25ms时,回声可以被人感觉出来,应该配备回波控制设备EC,EC一般基于DSP 技术,采用有限冲击响应滤波器(FIR)来模拟回波路径,产生回波信号,同实 际回波信号相减,达到回波抵消的作用。

21 3.5 回声抵消技术(续) 线路回声 线路回声是由于二/四线转化时混合线圈的不匹配引起的。由于混合线圈的不平衡造成电流泄漏,一部分能量被反射回信号源,形成了回声。线路回声产生于PSTN中,但同样会传至于VOIP网络。 线路回声消除主要是基于预测滤波器来实现的,该滤波器能根据参考信号,预测出接收信号的回声,并将回声从信号中扣除,从而获得“干净”的信号。 声学回声又分为直接回声和间接回声。 直接回声是指扬声器播放出来的声音未经任何反射直接进入麦克风。这种回声延 迟最短,它与远端说话者的语音能量,扬声器与话筒之间的距离、角度、扬声器 的播放音量以及话筒的拾取灵敏度等因素相关。 间接回声是指扬声器播放的声音经不同的路径一次或多次反射后进入麦克风所产 生的回声集合。因为周围物体的变动,例如人的走动等,都会改变回声的返回路 径,因为这种回声的特点是多路径、时变的。另外,背景噪声也是产生回声的因 素之一。

22 3.5 回声抵消技术(续) 声学回声 声学回声是指扬声器播放出来的声音被麦克风拾取后发回远端,这就使得远端谈话者能听到自己的声音。
声学回声消除方法: 周围环境的处理 回声抑制器 声学回声消除器 声学回声消除方法: 周围环境的处理 分析声学回声的产生的机理,可以知道:声学回声最简单的控制方法是改善扬声器 的周围环境,尽量减少扬声器播放声音的反射。例如,可以在周围的墙壁上附加一 层吸音材料,或增加一层衬垫以增加散射,理想的周围环境是其回响时间或RT-60 (声音衰减60dB所需要的时间)在300ms~600ms之间。因为这样的环境一方面可 以控制反射,又可以不会使讲话者感到不适。改善环境可以有效地抑制间接声学回 声,但对直接声学回声却无能为力。 回声抑制器 回声抑制器是使用较早的一种回声控制方法。回声抑制器是一种非线性的回声消除 。它通过简单的比较器将接收到准备由扬声器播放的声音与当前话筒拾取的声音的 电平进行比较。如果前者高于某个阈值,那么就允许传至扬声器,而且话筒被关闭 ,以阻止它拾取扬声器播放的声音而引起远端回声。如果话筒拾取的声音电平高于 某全阈值,扬声器被禁止,以达到消除回声的目的。 由于回声抑制是一种非线性 的回声控制方法,会引起扬声器播放的不连续。影响回声消除的效果,随着高性能 的回声消除器的出现,回声抑制器已很少人使用了。 声学回声消除器 声学回声消除的另一方法是使用声学回声消除器(AEC:Acoustic Echo Chancellor),AEC是对扬声器信号与由它产生的多路径回声的相关性为基础,建立 远端信号的语音模型,利用它对回声进行估计,并不断地修改滤波器的系数,使得 估计值更加逼近真实的回声。然后,将回声估计值从话筒的输入信号中减去,从而 达到消除回声的目的,AEC还将话筒的输入与扬声器过去的值相比较,从而消除延 长延迟的多次反射的声学回声。根椐存储器存放的过去的扬声器的输出值的多少, AEC可以消除各种延迟的回声。

23 3.6 语音传输技术 实时传输技术主要是采用实时传输协议RTP。RTP 是提供端到端的包括音频在内的实时数据传送的协议。
RTP协议在VOIP中的用途: 解决包传输中的乱序 消除IP网络传输中的网络抖动 编解码类型的指示 静音传输的指示 可以传输一些信令、事件、DTMF等(DTMF采用RFC2833方式进行带内传输) RTP/RTCP,实时传输/控制协议,在VoIP中是语音实时传输的协议。为了保证实时性, RTP分组是通过UDP进行传输的。 由于分组交换电路的特性,语音分组在IP网络上传输的时候,在不同的网络状况下,存 在延时、抖动、乱序、丢包如果不进行相应的处理,将会严重的影响话音质量。 RTP的在VoIP中的作用为 消除抖动,由于网络的阻塞,引起转发数据的突发性,导致每个分组到达目的地 的时间不相同,这就是我们所说的抖动,我们需要使用一个缓冲区来保证分组能 均匀的送给解码器进行解码,就是我们通常所说的JITTER BUFFER。 Jitterbuffer越大,能消除的抖动就越大,但带来的时延也越大。 排序,由于分组可能经过不同的路由到达目的地,这就可能存在乱序的情况,先 发出来的分组可能后到。我们就必须利用RTP头的序号来对RTP分组进行排序, 以便解码器对语音分组进行正确的解码。 丢包,这是一种比较严重的情况,有的人利用RTP包冗余来防止丢包,但是本人 认为这不是一个好办法,因为这将占用很大的带宽,而且随着冗余包数的增加, 将会占用更大的带宽。本来发生丢包的情况,网络状况就差,此时又采用这么大 的带宽,势必会更差。目前,RTP采取的方式为通过丢包指示(BFI)告诉解码器, 解码器利用内差的方法来产生近似的数据来消除丢包影响。 在一定场合下可以传输的DTMF信号,信号音和信令,具体办法详见RFC2833文档。

24 3.7 语音防抖动技术 语音网关通常采用JitterBuffer来消除抖动。 JitterBuffer 增加了端对端的时延。

25 3.8 语音质量

26 3.8 语音质量 ITU G.113定义了传输损伤及他们对语音质量的影响。 传输网络的影响 编解码 可能会丢包(frame loss)
可能会延时(latency) 不同的编解码带来的延时(jitter) 编解码 数模转换 模数转换 语音压缩算法带来的语音质量的降低

27 3.8 语音质量 语音质量评价方法:MOS(Mean Opinion Score)测试。 MOS分值对照表 级别 MOS分值 用户体验 优
5.0 非常好,听得很清楚,无失真感,无延迟感 4.0 稍差,听得清楚,延迟小,有点杂音 3.0 还可以,听不太清楚,有一定延迟,有杂音,有失真 2.0 勉强,听不太清楚,有较大杂音或断续,失真严重 1.0 极差,静音或完全听不清楚,杂音很大

28 3.9 窄带中继E1/T1 E1和T1是两种独立的、不同的标准的TDM(时分复用)技术,在OSI参考模型中则属物理层。
基本特征 E1和T1 1 采样频率 8 KHz 2 每通道电话信号的采样次数 8000 3 PCM帧的长度 1/b=1/8000 s=125 微秒 4 每采样点的编码字的位数 8 5 每通道的速率 b*d=8000*8=64 kbit/s

29 3.9 窄单中继E1/T1(续) E1和T1对比 差 别 E1 T1 编解码方法,段数 A-law ,13段 u-law ,15段
差 别 E1 T1 编解码方法,段数 A-law ,13段 u-law ,15段 每PCM帧的时隙数 32 24 每PCM帧的位数 d*g=8*32=256 d*g+1=8*24+1=193 每时隙的时长 (c*d)/h=(125*8)/256=大约3.9 ms (c*d)/h=(125*8)/193=大约5.2 ms PCM系统的比特率 b*h=8000*256=2048kbit/s b*h=8000*193=1544kbit/s 主要使用区域 欧洲、中国 美国、加拿大、日本

30 总结 企业通信的发展历程 信令协议与语音 VoIP

31


Download ppt "目标 学完本课程后,您将能够: 企业通信发展历程; 了解VOIP概念; 区分VOIP与PSTN区别; 了解VOIP关键技术;"

Similar presentations


Ads by Google