一种对于单声道声源定位的3D声音定位算法DSP执行器

Slides:

Advertisements

Similar presentations

2 、 5 倍数的特征学习目标 1. 掌握 2 、 5 倍数的特征，能判断一个数是否是 2 、 5 的倍数。 2. 理解奇数和偶数的意义，正确判断一个数是奇数还是偶数。

Advertisements

中外领导力的跨文化比较分析主讲人：. 壹领导力理论中国古代 “ 修身、齐家、治国、平天下 ” —— 孔子（儒家思想）庄子（道家学派）老子（道家学派）

頭皮的健康與診斷頭皮保養的目的乾性頭皮的產生原因及處理油性頭皮的產生原因及處理植物精油芳香療法的認識與應用第 3 章頭皮部位的處理 ………………………………………………………………………….…

窮人與富人的決定性差異書名：窮人與富人的距離 0.05mm 作者：張禮文出版社：海鴿. 窮人與富人的決定性差異窮人和富人的關鍵差異不在口袋金錢的多寡，而在腦袋。這本書將全面解開窮人之所以貧窮，而富人之所以富裕的所有奧秘。窮人和富人的關鍵差異不在口袋金錢的多寡，而在腦袋。這本書將全面解開窮人之所以貧窮，而.

一、研究背景植物组培育细胞培养源于 19 世纪后半叶，当时植物细胞全能性的概念还没有完全确定。人们便对此进行研究。目前，植物组培已经变成了一种常规的技术，广泛应用于植物的脱毒，快繁，基因工程，一串研究，次生代谢物质生产，工厂化育苗等多方面。

九年级物理一轮复习第一章声现象知识要点. 1. 声音的产生和传播  （ 1 ）声音的产生：声音是由于物体的振动产生的。  凡是发声的物体都在振动。振动停止，发声也停止。  （ 2 ）声源：正在发声的物体叫声源。固体、液体、气体都可以作为声源，有声音一定有声源。  （ 3 ）声音的传播：声音的传播必须有介质，声音可以在.

信息的传递九年级物理电磁波的海洋. 感悟固定电话之间有电话线连接着，信息是由电流通过电话线传递的移动电话之间没有电话线连接，它是靠什么传递信息的？

第一章声现象第二节声音的特征.

大学生入党积极分子培训教材主编：蔡中华曹培强.

29.2 三视图.

第 3 章聽覺每章扉頁 3.1 聽覺 3.2 人類耳朵的反應 3.3 聽覺缺陷.

第二章營建規劃施工與管理營建工程過程不外乎規劃、設計、施工、管理等。

國立金門高級農工職業學校水產養殖科游育霖

程啸（法学博士、清华大学法学院副教授、硕士生导师、洪堡学者）

学习情境三桥梁下部结构的构造与施工桥梁墩台的构造.

九寨沟领略人间仙境.

机关公文基础知识黄晓璐.

鞍钢冷轧钢板（莆田）有限公司毕业生招聘宣讲会

《数学》( 新人教版.七年级上册 ) 第一章有理数授课人:三元中学苏鼎明.

第二單元校園的昆蟲 1. 校園的小動物 2. 昆蟲一族 3. 昆蟲變變變 4. 我的昆蟲寶貝 5. 昆蟲博覽會吳端敏製.

机械工业发展史.

第一部分中考基础复习第一章声现象.

眼科B超的原理及使用方法一基础知识.

项目一超声波探伤的物理基础广州铁路职业技术学院陈选民.

第二十一章信息的传递电磁波的海洋九年级物理.

第十章暑温辽宁中医药大学温病学教研室.

桥城中学创建广东省现代教育技术实验学校自查报告

熱帶雨林對人類的局限和可能性.

第二課鬼頭刀廖鴻基.

6-3 玻璃製品一、平版玻璃將熔融的玻璃漿由滾筒間流過，可不斷製造較大連續之玻璃，可分為（一）透明玻璃：表面光滑清透。

第19章走进信息世界第二节让信息飞起来.

钢筋混凝土楼梯模板施工学习目标主要内容.

2014年国家义务教育质量监测体育现场测试说明浙江省教育质量监测中心 2014年11月.

長榮中學高中部104年甄選入學作業相關事項說明會

健康檢查簡介新湖國小健康中心王淑華護理師 99/11/17.

指導老師：曾憲正老師組員：公廣2A 4980M089鄭欽鴻 M039鄭仁凱 2B M060呂明耿

昆蟲總動員三年級教學群.

风温主讲人王洪京.

东方底特律—— 大美十堰.

春温主讲人王洪京.

市场营销原理与实训市场营销策略模块项目五产品策略.

第三节渐开线圆柱齿轮精度等级及应用.

第一章复习锦囊妙计多看书多看笔记善于梳理.

乳房护理主编：卢荣华.

第四章室内设计与人体工程学第一节人体工程学与室内设计人体工程学也叫人机工程学、人类工效学、人类工程学、工程心理学、宜人学等。

高二选修外力作用下的振动.

重庆市渝州工程勘察设计技术服务中心---刘刚 2013年3月29日

4个故事在很久很久以前….

实验三声速的测定南京农业大学物理实验中心.

前列腺结石山西医科大学第一医院王靖宇.

全日制义务教育物理课程标准 ——“运动与相互作用”主题解读及实施建议

第十章信息的传递一、电话 1、电话的诞生 1876年贝尔发明了电话。最简单的电话由话筒和听筒组成，话筒能把声信号变成电信号，听筒能把电信号变成声信号。

第十一章结构施工图 11-1 概述一、结构施工图（结施）：P308

第一章气压传动概述一、气压传动基本知识机电一体化技术 1）传动--动力的传递

聲音講解／陳記住老師謹向圖中人物表達謝意….

第3章.建筑剖面设计学习要求与学习重点 1. 学习要求：熟悉建筑各部分高度、层数、层高的确定；掌握建筑空间的组合和利用；能够根据建筑的使用要求合理地确定建筑的剖面形状和尺寸。 2.学习重点：掌握建筑各部分高度的确定及层数、净高、层高的概念；掌握室内外高差确定的依据；掌握建筑空间的利用的方法。

电子信息工程系热烈欢迎来自全国各地的新同学！.

身边的噪音 ——六（1）班班队活动李瑷蔚符蓉.

日本班級：六年四班座號：　八號姓名：楊維綱.

数字信号处理基础第7章 FIR数字滤波器的理论和设计

九年级物理信息的传递第二节电磁波的海洋.

《信息技术与教育技术》听觉媒体技术.

力学实验复习杨昌彪月.

2.4 让声音为人类服务.

智力抢答器综合设计陈学英.

聲音是一種波測驗題庫陳記住錄製分享資料來源：教育部國民中學學習資源網．

声音的特性.

Presentation transcript:

一种对于单声道声源定位的3D声音定位算法DSP执行器 DSP IMPLEMENTATION OF 3D SOUND LOCALIZATION ALGORITHM FOR MONAURAL SOUND SOURCE

摘要这篇论文描述了一个实时的3D声音定位算法.通过使用一个低功耗嵌入式DSP来执行验证。这种执行器的最大不同在于音频被分成了三段，通过分析声音的反射和衍射效应对于不同的媒介来自于一定的声源。在低、中、高三个不同的子频带。3D声音定位的不同方案被设计通过一个IIR滤波器，参数补偿器和comb滤波器。以实现在一个实时的DSP上运行。它是在一个50MHZ的低频下运行的。来保持高质量的声音定位效果。通过一个目标听者测试，这个3D声音定位系统可以用于移动听筒，或者手机等嵌入式设备。

引言最近几年里，在声学信号处理领域里一些复杂的方法已经被使用来实现3D声音作用。主要建立在一个所谓的头相关传递函数（HRTF）基础上的它是受到声源的反射和衍射作用影响的。通常情况下，给定一个声源，3D声音定位可以实现在基于HRTF上从声源到左右耳。

一个HRTF特性通常过于复杂对于不同的数字滤波为了有更大的自由度必须在整个过程都改变参数。然而，这个HRTF的方法已经不能胜任一个DSP的实时3D声音定位。为了解决这些困难，这篇论文设计了一个实时3D声音定位算法的DSP执行器。在它上面计算的复杂度被评估去说明这种方法的可行性。最后声音质量被评估由一个目标听者测试。

通常的3D声音定位方法通常的HRTF的3D声音定位系统可以被简单的描述如下：首先，计算必要的HRTF函数，可以通过两个等式来实现。一个是代表给定的声源信号，另一个是表明来自于虚拟头微听筒的声音输出。然后，单声道输入数据被这些HRTF函数处理，最后把结果提供给了输出的立体听筒

通常情况下，HRTF的频率响应特性是如此复杂以至于需要大量的数字滤波对于3D声音定位。例如，一个参数补偿器是由大量的数字滤波器组成的。所有的参数包括频率，增益，和质量因子等都要考虑在内。而且，不同的频率响应特性对于左耳右耳都不同，这样就需要很多的不同结构的滤波器。如果都用参数补偿器来实现HRTF，单声道就需要30个补偿器。结果，这种方法还有很多的空间来改变计算复杂性的障碍，为了完成3D声音定位的DSP执行器。

传奇的实时算法为了给出一个新的算法我们首先分析了HRTF函数为了提炼出主要的因素来降低全部的计算复杂性。图1描述了一个HRTF频率响应通过双耳记录在一个右耳的45度角设置声源。通常情况下，通常一个HRTF频率特性可以像图1那样分三个子带，其中低频带特性曲线很平滑的上下改变。在中层的带宽突然的跌破的改变，高频呢是剧烈的震动。因此，在下面一个有效的模拟衍射特性的方案被用于每个频段。

3.1低频带在低频带，从0.1-1.2KHZ的频率，响应在这里很平缓的上下波动。而且在这一阶段左右耳的不同假设音速和头直径是340m/s和150-200mm边界频率是f=v/（2d）=850-1100hz。结果，可以被证明在这个频带里，头部的声音衍射必须被考虑为一个主要的因素。仅仅通过声音容量和延迟在两耳的不同对于定位有很多的影响。为了实现这些参数一个IIR滤波器可以被使用，这个特性可以被构造通过采用一个高通IIR滤波。

3.2高频带现在，我们考虑声音衍射通过人耳，假设人耳是一个圆锥体直径在35-55mm，如果声源半波长比基本直径短的话，这是就必须考虑它对声音衍射的影响了。可以通过一个comb滤波器来估计高频带的频率响应特性

3.3中频带在中频带主要是介于1khz到5khz之间。这里有一些突变的波形在图一中可以看到。因此，3D声音定位可以通过采用参数补偿来执行，对于左右耳在同样的方式，像通常的方法一样。因为这些复杂的特性很难精确的实现用带通滤波器。在这个频率里一个HRTF传函主要是被声音衍射通过头和耳等来影响的。在我们的算法里，PEQs仅仅在中带频段里用到，因此大量的步骤可以被减少。在通常的方法里在低高带里都用到了参数补偿器。

实时算法的DSP执行器我们采用了16位定点DSPTMS320C54x在图二中给出。正如图中所说，这个实时算法的执行程序被分成了三个阶段，第一，分频阶段。第二，声音定位。第三，混合。在这个已经完成的3D定位的例子里，听觉输入数据被分成了左右两个通道，并视听输入数据在时间队列里被一个一个的处理。每个阶段被归纳如下：

阶段一，分频：我们的实时算法是从把一个给定的频分音频输入分频开始的。声音被分成低中高三个频带，通过三个三阶低通带通和高通FIR滤波。例如FIR滤波器有一个特性是相位正比于频率。参数被存在了一个DSP的内部存储器。第二阶段，声音定位：3D声音定位调用听觉数据在每一个频带里。在这个阶段里，声源的方向和距离声源的位置在每个频带里被看做听觉数据。在低频带里，我们仅仅考虑在左右通道的声音延迟和体积参数。我们注意到3D声音定位系统可以被实现通过只使用一个一阶IIR滤波器。在中频带里，为了精确的产生一个HRTF的频率响应特性，三个三阶IIR滤波器被采用作为补偿器。在高频带里，一个comb滤波器，被采用来实现3D声音定位。共包括四个参数直接增益，效应增益，反馈增益和延迟是必须的。第三阶段，混合。在3D声音定位之后，三个频带的声音数据被混合。在这个混合阶段，每个数据可以被调整通过一个倍乘增益。整个延迟控制在图二中被用于两耳的到达时间的不同。

试验结果图三，显示了这种方法对于白噪声的响应。我们可以看到建议的方法成功的实现了HRTF的频率响应特性。

表二，归纳了我们方法对于普通方法的对比的结果。我们给的方法任然获得了“好”的评估

判断出了三个类型：声音定位，距离和方向。对于声音定位我们问的是“你能察觉到在在你头外的声源通过听筒吗？”对于距离我们问：“你能说出离你远1m的声音的位置”对于方向而言是：“你知道声音来自于哪个方向呢？”我们评估了五级“极好”“好”“一般”“差”“太差”。

结论这篇论文描述了一个基于实时3D声音定位方法的DSP执行器。它的特殊的之处在于这种方法把声音频带分为三个不同的频段。一个特殊的3D声音定位程序被用于每个阶段。用了一个16位定点DSPTMS320C54x实时3D声音定位方法对于一个给定的单声道声源可以被实现在一个50MHZ的低频保证了高质量的声音定位。结果，我们的新方法可以有效的提供一个听者一个3D定位通过听筒等等。这个是在一个低成本低功耗的DSP执行器上实现的。