基于PCANN的说话人识别方法研究(1)
2015-05-11 01:00
导读:计算机应用论文论文,基于PCANN的说话人识别方法研究(1)怎么写,格式要求,写法技巧,科教论文网展示的这篇文章是很好的参考:摘要 本文利用主分量分析神经网络(PCANN)方法,得到一种新的说话人语音特征
摘要 本文利用主分量分析神经网络(PCANN)方法,得到一种新的说话人语音特征。该特征通过对相继几帧语音特征参数组成的特征向量作主分量分析得到. 新的特征能有效的引入帧间相关信息,减小冗余度,削弱噪声的影响。实验表明,新特征提高了系统的识别性能。关键词 主分量分析神经网络(PCANN);特征提取;说话人识别;高斯混和模型(GMM)1 引言说话人识别是根据从说话人所发语音中提取信息判断说话人身份的过程。语音信号中包含了话音特征和说话人个性特征,说话人识别的关键问题之一是提取反映说话人个性的语音特征参数。在说话人识别系统中常用的语音特征参数主要有,LPC 倒谱系数(LPCC) 、Mel 频率倒谱系数(MFCC)、线谱对(LSP)等 。在纯净语音环境中,系统已经达到很好的识别性能,但是在实际应用的环境中,由于背景噪声的存在,系统往往达不到令人满意的效果。主分量分析PCA (primary component analyze)是
统计学中一种根据数据的统计分布特性,提取数据主要成分的数据处理方法. 它是最小均方误差下的最优正交变换,对消除模式间的相关性、突出模式间差异性有最佳的效果,所以常被用于数据的压缩和模式识别的特征提取 . 由于它需要对原始数据的方差矩阵进行估值并求取其特征值和特征向量, 计算量异常巨大, 而基于神经网络的主分量分析算法不必进行矩阵求逆运算,并且神经网络具有并行运算能力, 这将降低PCA 计算量, 提高PCA 的实用性 。对语音信号的原始特征作主分量分析后往往能得到更好的特征参数 。本文选用LPC倒谱系数作为表征声道的特征参数,采用相继的几帧组成的特征参数矢量作为样本,对其进行主分量分析,这样去除了特征中的冗余信息,压缩特征参数的维数,得到新的PCA特征参数,然后把PCA特征参数作为GMM模型的输入向量,进行说话人识别的训练和识别。本文第二节介绍主分量分析神经网络的原理和算法,第三节介绍高斯混和模型和LPCC特征参数,第四节给出相应的说话人识别系统实验和结果,最后是简要的讨论与展望。2 主分量神经网络(PCANN)主分量神经网络是基于Hebb 学习规则的线性无监督学习神经网络, 它可以通过对权矩阵W 的学习, 使W接近于原始数据X的关联矩阵C中特征值所对应的特征向量, 而不必进行矩阵求逆运算,提高了运算速度。2.1 基于Hebb学习的最大特征滤波器


2.2 基于Hebb 学习的主分量分析网络





图3:提取前m个主分量的神经网络解析图共2页: 1 [2] 下一页 论文出处(作者):
(科教范文网http://fw.NSEAC.com编辑发布) Web挖掘个性化模型研究
图象模板匹配技术在探针台系统中的应用