基于说话人聚类的说话人自适应(1)(2)
2015-01-13 01:13
导读:表示两个多维高斯分布, 为两个分布的均值向量, 表示两个分布的协方差矩阵。 最大似然线性回归法(Maximum Likelihood Linear Regression, MLLR)是一种基于变换

表示两个多维高斯分布,

为两个分布的均值向量,

表示两个分布的协方差矩阵。 最大似然线性回归法(Maximum Likelihood Linear Regression, MLLR)是一种基于变换的方法,它采用一组变换描述从初始模型到说话人自适应(Speaker Adaptation, SA)后模型的变换关系,另外MLLR还能对不同的信道及附加噪声有一定补偿作用。一般认为不同说话人之间的差异主要表现在均值矢量上,式(6)为均值转换的估计式。

(6) 其中

是混合成份s的转移矩阵,

是自适应后的均值后的均值向量,

是混合成分s的扩展均值向量,其定义如下:

(7) 3 模型间的差别度量 可以将一个GMM的参数看作一组语音特征,考察这组特征在另一个GMM中的输出概率。用输出概率来衡量两个模型间的距离[4]。 其方法如下:把GMMA的
M个混元的均值向量当作
M个观测向量,计算这
M个观测矢量在GMMB下的概率。类似地,计算GMMB的
M个混元的均值向量在GMMA下的概率。定义GMMA和GMMB的单边加权似然度为:

(8) 其中,CAi 表示GMMA第 i 个混元的权值, μAi表示第 i 个混元的均值向量,

表示GMMA第 i 个混元的均值向量在GMMB下的概率,同理可得GMMB和GMMA的单边加权似然度 :

共2页: 1 [2] 下一页 论文出处(作者):
(转载自http://www.NSEAC.com中国科教评价网) 一种实现双向认证的动态口令身份认证方案
基于ESMTP的水文数据共享方法设计与实现