語音處理簡介.

Slides:



Advertisements
Similar presentations
第二节 东南亚 地理位置和自然环境 一 地理位置和 范围 1 地理位置 1 地理位置 纬度位置 纬度位置 海陆位置 海陆位置.
Advertisements

复习提问 1. 从物理角度来说说什么是噪声? 从物理角度来说噪声是指发声体做无规则 的振动时发出的声音。 2. 从环境保护角度来说说什么是噪声? 从环境保护的角度看:凡是妨碍人正常休 息,学习和工作的声音,以及对人们要听 的声音 起干扰作用的声音,都属噪声。
抽菸與檳榔之危害 臺北榮總 蘇澳分院 李麗鳳 護理師. 吸菸者的誤解 吸菸可以提高工作效率 防止憂鬱症 增加社交交流 增加經濟消費.
index 目次 ( 請按一下滑鼠,解答就會出現喔 !) 接續下頁解答 3-1 極限的概念.
【演示】:将硬币从高处静止释放。 问:观察到运动的特点是什么? ( 1 ) v 0 =0 ; 今天我们就来深入认识这一类运动 —— 自由落体运动 ( 2 )竖直下落。
银河证券望京营业部整体房产 转让项目推介. 一、办公楼简介 1 、项目位置 北京市朝阳区望京 西园乙 410 号楼.
形式逻辑学的框架 推理 判断 概念 演绎 归纳 直 接 复 合 三段论 枚 举 完 全 科 学 【有效性与真实性】
ME 的自我介紹  葉曈. 個人資料 我的名子是葉曈 -.-  我的星座是天秤座  我的血型是 AB 型 ^-^
九年级物理一轮复习 第一章 声现象 知识要点. 1. 声音的产生和传播  ( 1 )声音的产生:声音是由于物体的振动产生的。  凡是发声的物体都在振动。振动停止,发声也停止。  ( 2 )声源:正在发声的物体叫声源。固体、液体、气体 都可以作为声源,有声音一定有声源。  ( 3 )声音的传播:声音的传播必须有介质,声音可以在.
信息的传递 九年级物理 电磁波的海洋. 感 悟 固定电话之间有电话 线连接着,信息是由 电流通过电话线传递 的 移动电话之间没有电 话线连接,它是靠什 么传递信息的?
第四單元 通電的玩具 張老師的網頁.
音樂科技導論 音訊錄製入門.
第 3 章 聽覺 每章扉頁 3.1 聽覺 3.2 人類耳朵的反應 3.3 聽覺缺陷.
浙江麒麟岛开发项目建议书.
第五章 话语的语用意义(上) 主讲人:周明强.
学习情境三 桥梁下部结构的构造与施工 桥梁墩台的构造.
高层民用建筑设计 孙淑萍 2008年3月.
高雄市小港區海汕國民小學 第一期校舍新建工程 工程現況簡報
第一部分 中考基础复习 第一章 声现象.
项目一 超声波探伤的物理基础 广州铁路职业技术学院 陈选民.
第二十一章信息的传递 电磁波的海洋 九年级物理.
【开心一分钟】 一到下午这个点就特么的困.
第五章 图像的校正和配准 数字图像与矩阵 灰度与直方图 图像产品处理流程 辐射校正 几何校正 校正方法应用.

經濟部工業局105年度 生產力4.0產業推動計畫—產業化輔導 製造業4.0產品設備輔導案 審 查 簡 報
第19章 走进信息世界 第二节 让信息飞起来.
火灾自救安全提示.
国王赏麦的故事.
一寸光阴一寸金 寸金难买寸光阴 时间.
主办:泰兴市质量强市领导小组办公室 承办:泰 兴 市 市 场 监 督 管 理 局.
2011年高考考前指导(物理) 报告人:詹道友 (合肥八中).
心理小测试:我是谁? 题目:你最喜欢下面哪一种冰淇淋? A.香草牛奶冰淇淋 B.有大块巧克力的冰淇淋 C.有香脆巧克力粒的冰淇淋
课前小游戏 手臂测量: 你有多喜欢你自己? 3/14/2017.
單擺的介紹.
生活与哲学 生活中处处有哲学.
第三节 渐开线圆柱齿轮精度等级及应用.
汽车空调制冷系统 作者:陈永刚.
DCS硬件系统 ——原理、指标、试验和应用
实验三 声速的测定 南京农业大学物理实验中心.
第十章 信息的传递 一、电话 1、电话的诞生 1876年贝尔发明了电话。最简单的电话由话筒和听筒组成,话筒能把声信号变成电信号,听筒能把电信号变成声信号。
第十九章 货币均衡 一、本章主要内容与结构安排 货币供求均衡与社会总供求平衡 货币均衡 通货膨胀 通货紧缩.
多媒体技术及应用 2017年9月9日星期六 第二章 多媒体音频技术 第二章 多媒体音频技术.
第二节救生艇种类及性能 一、救生艇的分类 缺点:没有支架和顶棚,人员暴露在自然环境中 (一)、按照结构形式分类 1、开敞式救生艇
7-1 能量的形式和轉換 1 of 12 能量是促成自然現象變化的根源,太陽能替我們將水搬到高處,人類再利用高、低水位差發電。
2014/08/总第58期 推荐阅读 ADCP声学多普勒流速剖面仪.
《生活与哲学》第一轮复习 第七课唯物辩证法的联系观.
第二章 控制系统的数 学模型 烟台大学光电学院.
Audio.
淺談音訊壓縮 程之奇.
第二章音訊媒體.
Unit 8. 数字媒体 Digital Media
第十三章 音频水印 13.1音频水印特点 13.2音频水印算法评价标准 13.3音频水印分类及比较
JX44B0实验系统教案 PWM实验 武汉创维特信息技术有限公司 2018/12/29.
一、選擇題 ( )1、下列敘述何者錯誤? (A)由彈弓射出的石子具有能量 (B)一物體具有作功的本領,則此物具有能 量 (C)被壓縮的彈簧具有能量,被拉長的彈簧 則不具有能量 (D)將地面的重物,吊到高處則此物具有能 量。 C.
新员工入职培训 --财务部.
电路原理教程 (远程教学课件) 浙江大学电气工程学院.
第八章 运动和力 第1节 牛顿第一定律和惯性 (第2课时  惯性).
媒体基础(一) 向辉 山东大学软件学院 2003年秋季.
PLM 功能介绍 项目管理 用友网络股份有限公司 2018年3月.
第六章 海洋中的混响.
红外遥控器 MCU起航 QQ:
第三章 光现象 三、光的直线传播.
光的直线传播 鸡泽县实验中学.
牛顿第一定律.
數學遊戲二 大象轉彎.
13.2 物质波 不确定关系 微观粒子的波粒二象 + ? 德布罗意假设(1924年): 实物粒子具有波粒二象性。 波长 频率
2.4 让声音为人类服务.
多姿多彩的世界.
第三章时 域 分 析 引言 语音信号的短时处理方法 短时能量和短时平均幅度 短时平均过零率 短时自相关函数 短时时域处理技术应用举例
Presentation transcript:

語音處理簡介

語音處理簡介 聲音訊號(Audio Signals):泛指由人耳聽到的各種聲音的訊 號 聲音代表了空氣的密度隨時間的變化,是一個連續的函數, 將聲音儲存到電腦時,必須先將訊號數位化,其中有幾個 參數需要考慮: 取樣頻率(sample Rate),常用的取樣頻率如下: (1) 8 kHz (2) 16 KHz (3)22.05 KHz (4)44.1 KHz 取樣解析度(Bit Resolution):每個聲音資料點所用的位 元數,常用的數值如下: (1) 8-bit (2) 16-bit 聲道:一般只分單聲道(Mono)或立體聲(Stereo),立體 音即是雙聲道

辨識流程 預處理 特徵擷取 訓練 辨識 物種結果

語音預處理 預強調 取音框 窗函數

預強調 為了補償語音在空氣傳送中,所衰減的高頻訊號,故將語音訊號 s(n) 通過一個高通濾波器,其公式為: 舉例來說,某一訊號前三個取樣值如下所示: 其中a為一個0.9 ~ 1.0之間的值,一般都取0.95 Value … 1200 1100 1300 Index x(0) x(1) x(2) …

預強調 經由預強調的值s為: s(0): s(0) = x(0) = 1200 s(1): x(1)-0.95*x(0) s(2): = 1100-0.95*1200 = - 40 x(2)-0.95*x(1) = 1300-0.95*1100 = 255

音框化 在分析聲音時,通常以「短時距分析」(Short-term Analysis)為主,因為音訊在短時間內是相對穩定的。 一般音框長度範圍為10ms至40ms之間,且為防止前後音 框變化劇烈,因此允許音框之間有重疊,重疊部分可以是 音框長度的 1/2 到 2/3 不等 切音框示意圖

音框化 假設取樣頻率為16kHz,音框長度取25ms,音框重疊部分為15ms,則: 音框點數: 取樣點數(fs)*時間長度= 16kHz * 25ms =400點 音框重疊點數: 取樣點數(fs)*重疊時間長度= 16kHz * 15ms =240點 音框前進點數: 音框點數-音框重疊點數= 400-240 = 160點

音框化 總音框數: 一個長度1秒,取樣頻率16kHz的語音,總音框數為: (訊號總取樣點– 音框點數)/音框前進點數+1 =(16000-400)/160+1 =98.5 出現小數點,取無條件進入法,最終總音框數為99

音框示意 以上是音框示意圖, 音框點數(音框的長度): 4點 音框重疊部分: 1/2 音框重疊點數: 2點 總音框數: (16-4)/2+1=7

窗函數 為了消除視窗兩邊的訊號的不連續,通常會加上漢明窗(Hamming Window),其公式為: otherwise 其中 N為音框點數

窗函數 漢明窗 漢明窗頻率響應

窗函數