语音信号的短时分析技术 对语音信号采用分段(或称分帧处理),称为短时分析。 短时平均能量 短时能量分析 窗口形状的选择 窗口的长度 主要用途: 区分清音段和浊音段 窗口的长度 短时平均幅度 准周期脉冲 序列发生器 浊音 短时过零分析 基音周期 时变线性 系 统 短时相关分析 语音采样值 清音 随机噪声 发 生 器 短时频谱分析 时变参数 增益控制 语音产生的数字模型
语音信号的特征提取与组合 基频 声门特征 短时平均能量 语音速率 Mel倒谱系数(MFCC、差分MFCC) 声道特征 线性预测倒谱系数(LPCC、差分LPCC) 组合成同一帧的倒谱特征 组合特征 声门特征与声道特征组合,将声门特征组合到同一帧的倒谱特征。 (文本相关的说话人识别)
线性预测(简写为LPC)分析的基本原理是将被分析的信号用一个模型来表示,即将信号看作是一个模型(即系统)的输出,用模型参数来描述信号。 语音信号的线性预测分析 线性预测(简写为LPC)分析的基本原理是将被分析的信号用一个模型来表示,即将信号看作是一个模型(即系统)的输出,用模型参数来描述信号。 s(n) x(n) H(z) 信号s(n)的模型化 线性预测分析就是根据已知信号s(n)对各参数 和增益A进行估计。在这里 为线性预测系数。
最小平方逆滤波设计法
Z反变换 或有平方误差 最小
根据 和 有
即
则 由此得到
写出矩阵形式 可求出
数字滤波器的时域设计
1、h(n)求法
或
将该式表示成矩阵形式 = 由矩阵给出的线性方程组可以求得滤波器的
2、已求得h(n)的情况下,构造系统函数H(z) IIR滤波器的一般表达式: 现在的任务是,已知 ,求出系数 和 (r=0,1…M,k=0,1…N), 使该系统逼近已知 ,因此 与 的关系必须满足
上式成立的条件是等式两段相同的 前的系数必须相等。 或满足 上式成立的条件是等式两段相同的 前的系数必须相等。 因此,上式中 此式可求得构成 中的所有M个 值 以及 此式可求得构成 中的N-M个 值
由前述分析可以看出:当输入序列x(n)的长度为M,输出序列y(n)为N时,相应的系统函数为: 其中的参数 由下式求得: 参数 由下式求得: 而参数h(n) 由前面的(1)的讨论求得(即已知x(n)和y(n),求h(n) ):
3、系统函数H(z)的矩阵逼近技术 选择IIR滤波器系统函数H(z)中递归分母式的阶次等于非递归分子多项式阶次M时,有: 展开为: 把逼近已知h(n)的前2M个采样点,并把上式中相同 的系数方程写成矩阵形式:
在计算系统参数时,上面的矩阵可分为两个部分,即: 在计算系统参数时,上面的矩阵可分为两个部分,即:
这样可由 (A)式求出M个非递归参数 ,然后再由(B)式求出M个非递归参数 ,从而完成 IIR 滤波器系统函数 (A) (B) 这样可由 (A)式求出M个非递归参数 ,然后再由(B)式求出M个非递归参数 ,从而完成 IIR 滤波器系统函数 的设计。