基于16位单片机的语音电子门锁系统网络(2)

2014-02-26 02:39

导读：（2）基于声道特征模型，通过线性预测分析得到的参数。包括线性预测系数（LPC）以及由线性预测导出的各种参数，如线性预测倒谱系数（LPCC）、部分相

　　（2）基于声道特征模型，通过线性预测分析得到的参数。包括线性预测系数（LPC）以及由线性预测导出的各种参数，如线性预测倒谱系数（LPCC）、部分相关系数、反射系数、对数面积比、LSP线谱对、线性预测残差等。根据前人的工作成果和实际测试比较，LPCC参数不但能较好地反馈声道的共振峰特性，具有较好地识别效果，而且可以用比较简单的运算和较快的速度求得。
　　（3）基于人耳的听觉机理，反映听觉特性，模拟人耳对声音频率感知的特征参数。如美国尔倒谱系数（MFCC）等。MFCC参数与基于线性预测的倒谱分析相比，突出的优点是不依赖全极点语音产生模型的假定，在与广西无关的说话人识别系统中MFCC参数能够比LPCC参数更好地提高系统的识别性能。
　　此外，人们还通过对不同特征参数量的组合来提高实际系统的性能。当各组合参量间相关性不大时，会有较好的效果，因为它们分别反映了语音信号的不同特征。
　　在计算机平台的仿真实验中，通过各种参数的实际比较，采用MFCC参数比采用LPCC参数有更好的识别效果。但在SPCE061A平台上做实时处理时，与LPCC系统相比，MFCC系数计算有两个缺点：一是计算时间长；二是精度难以保证。由于MFCC系统的计算需要FFT变换和对数操作，影响了计算的动态范围；要保证系统识别的实时性，就只有牺牲参数精度。而LPCC参数的计算有递推公式，速度和精度都可以保证，识别效果也满足实际需要。
　　本系统采用了基音周期和线性预测倒谱系数（LPCC）共同作为说话人识别的特征参数。
　　1．2．2 LPCC参数的提取
　　基于线性预测分析的倒谱参数LPCC可以通过简单的递推公式由线性预测系数求得。递推公式如下：

其中p为LPC模型的阶数，也是模型的极点个数。

（1）LPC模型阶数p的确定（科教论文网 lw.nSeAc.com编辑发布）
　　为使模型假定更好地符合语音产生模型，应该使LPC模型的阶数p与共振峰个数相吻合，其次是考虑声门脉冲形状和口唇辐射影响的补偿。通常一对极点对应一个共振峰，10kHz采样的语音信号通常有5个共振峰，取p=10，对于8kHz采样的语音信号可取p=8。此外为了弥补鼻音中存在的零点以及其他因素引起的偏差，通常在上述阶数的基础上再增加两个极点，即分别是p=12和p10。实验表明，选择LPC分析阶数p=12，对绝大多数语音信号的声道模型可以足够近似地逼近。P值选得过大虽然可以略微改善逼近效果，但也带来一些负作用，一方面是加大了计算量，另一方面有可能增添一些不必要的细节。
　　（2）线性预测系数的求取
　　自相关解法主要有杜宾（Durbin）算法、格型（Lattice）算法和舒尔（Schur）算法等几种递推算法。其中在杜宾算法是目前最常用的算法，而且在求取LPC系数时计算量也量小，本系统采用该递推算法。
1．2．3 基音参数的提取
　　基音估计的方法很多，主要有基于短时自相关函数和基于短时平均幅度差函数（AMDF）等基音估计方法。
　　（1）基于短时自相关函数的基音估计
　　短时自相关函数在基音周期的整数倍位置存在较大的峰值，只要找出第一最大峰值的位置就可以估计出基音周期。
　　（2）基于短时平均幅度差函数（AMDF）的基音估计
　　基于短时平均幅度差函数（AMDF）在基音周期的整数倍位置存在较大的谷值，找到第一最大谷值的位置就可以估计出基音周期。这种方法的缺点是当语音信号的幅度快速变化时，AMFD函数的谷值深度会减小，从而影响基音估计的精度。
　　实际上第一最大峰（谷）值点的位置有时并不能与基音周期吻合，第一最大峰（谷）值点的位置与短时窗的长度有关且会受到共振峰的干扰。一般窗长至少应大于两个基音周期，才可能获得较好的估计效果。语音中最长基音周期值约为20ms，本系统在估计基音周期时窗长选择40ms。为了减小共振峰的影响，首先对语音进行频率范围为Hz的带通滤波。因为最高基音频率为450Hz，所以将上限频率设为900Hz可以保留语音的一、二次谐波，下降频率为60Hz是为了滤除50Hz的电源干扰。

上一篇：论利用ebXML和SOAP开发Web服务网络毕业论文下一篇：没有了