计算机应用 | 古代文学 | 市场营销 | 生命科学 | 交通物流 | 财务管理 | 历史学 | 毕业 | 哲学 | 政治 | 财税 | 经济 | 金融 | 审计 | 法学 | 护理学 | 国际经济与贸易
计算机软件 | 新闻传播 | 电子商务 | 土木工程 | 临床医学 | 旅游管理 | 建筑学 | 文学 | 化学 | 数学 | 物理 | 地理 | 理工 | 生命 | 文化 | 企业管理 | 电子信息工程
计算机网络 | 语言文学 | 信息安全 | 工程力学 | 工商管理 | 经济管理 | 计算机 | 机电 | 材料 | 医学 | 药学 | 会计 | 硕士 | 法律 | MBA
现当代文学 | 英美文学 | 通讯工程 | 网络工程 | 行政管理 | 公共管理 | 自动化 | 艺术 | 音乐 | 舞蹈 | 美术 | 本科 | 教育 | 英语 |

采用离散HMM的孤立词识别系统(1)

2015-04-07 01:17
导读:计算机应用论文论文,采用离散HMM的孤立词识别系统(1)在线阅读,教你怎么写,格式什么样,科教论文网提供各种参考范例:摘 要 本文探讨了离散马尔可夫模型的基本原理及在孤立词识别中的应用,并且
摘 要 本文探讨了离散马尔可夫模型的基本原理及在孤立词识别中的应用,并且实现了一个文本有关的孤立词识别系统,其正确识别率达到96.3%。关键词 隐马尔可夫模型 Mel频率倒谱系数 矢量量化 语音识别1 引言目前,隐马尔可夫模型技术是语音信号处理中的主流技术,孤立词识别是语音识别的一个重要分支,可以有效地应用于电话查询、电话银行业务等领域,有很高的实用价值。离散HMM在训练及识别时计算量小,对输入矢量的分布不必作先验假设,因而在对实时性要求较高的场合得到了较多的应用。本文实现的是一个基于离散的HMM的孤立词识别系统。2 HMM对语音信号的描述及应用语音信号是通过声源经声道处理产生的,是一种时变的随机信号。我们的语音发音是有限的,所有可以认为声道的状态是有限的。我们将人的声道特性划分为有限个特性平稳的部分或状态,每个状态对声音信号作用产生受该处的声道物理参量决定的短时信号[1]。这样,声道特性的变化用HMM的状态转移概率来描述,某一声道特性产生短时语音信号观察值的概率分布用HMM的状态生成概率表征,则HMM模型就有效地用于描述时变语音信号。3 系统实现3.1 特征矢量的形成语音信号的采样率为8K,采样后的语音信号通过预加重运算、分帧、最后将每帧语音转换成相应的特征矢量,本系统的特征矢量是采用20阶MFCC(mel – frequency cepstral coefficient)系数,即mel倒谱系数,对应于一个短时帧的20阶MFCC系数组成的20维矢量空间的一个特征矢量。3.2 HMM 结构和状态数的选择在小词汇表、孤立字词识别时,HMM多采用自左向右无跳转或有跳转模型,本系统采用的是无跳转的自左向右模型结构。在若干的汉字实验中表明,若状态数取6~8是较为合理的选择[3],本系统状态数为6。3.3 离散HMM的VQ码本形成采用DHMM ,则需对输入特征矢量进行VQ处理,即用LBG算法对话者的训练,集中所有的训练矢量(帧)训练出VQ码本。这里的关键是VQ码本容量的选值。实验结果表明,当码本容量小于64时,随着码本容量增加,正确识别率仍有提高,当容量大于256时,提高就不明现,故目前常用的容量值取为64、128、256。本系统取为64[4]。3.4 建立HMM训练由该VQ码本将训练集中的各个矢量序列量化为观察值符号序列,最后由Baum-Welch算法训练出离散的HMM。当系统中所有话者的VQ码本及离散HMM(记为 )都训练完毕并存储起来之后,该系统的训练任务就完成了。1)前向、后向概率前向概率的递推公式为:共2页: 1 [2] 下一页 论文出处(作者):
(转载自http://zw.NSEAC.com科教作文网)

基于“CPLD SCM”结构的交流异步电机空间矢量控制
基于UML的参数监控系统分析与建模
    上一篇:用OPENSSL实现电子商务中的CA认证(1) 下一篇:没有了