论文首页哲学论文经济论文法学论文教育论文文学论文历史论文理学论文工学论文医学论文管理论文艺术论文 |
图4-2 TLC320AD50C与TMS320VC5402硬件连接 (转载自http://zw.NSEAC.com科教作文网)
①外挂程序存储单元 采用一片27C512作为程序存储器,系统复位后,程序自动由EPROM中加载进入DSP的片内程序存储区运行。
②语音模板存储单元 采用一片AT29C020作为模板和语音存储器,通过BDMA接口与TMS320VC5402相连。
③系统复位与电源适配 电源复位、适配和监视电路由MAX705,TPS7301和TPS7333实现。
另外,采用74HC574做输出识别接口,这就构成了基本的语音识别模块。加上键盘、LCD显示接口和相应的译码电路,即可构成完整的控制器。
4.2.2接口设计
①TMS320VC5402串口的初始化 首先将DSP串口1复位,再对串口1的16个寄存器进行编程,使DSP串口工作在以下状态:以SPI模式运行,每帧一段,每段一个字,每字16b,采样率发生器由DSP内部产生,帧同步信号和移位时钟信号由外部产生。DSP给AD50C编程用查询方式,接收A/D转换的D信号和发送D/A转换的D信号用DMA方式。
②TLC320AD50C的初始化 首先由TMS320VC5402的同步串口发送两串16b数字信息到TLC320AD50C。第一串为0000 0000 0000 0001B,最低有效位(bits0=1)说明下一个要传输的数据字属于二次通信[2]。第二个数据值用来对TLC320AD50C的4个数据寄存器的某一个进行配置。Bits15~11位为0,Bits10~8位为所选寄存器地址值,Bits7~0位为所选中寄存器的编程值。并且使TLC320AD50C工作在以下状态:选择INP/INM为工作模拟输入,15+1位ADC和15+1位DAC模式,采样频率为8 kHz,模拟信号输入和输出放大增益均为0dB。
4.3语音信号的端点检测
语音信号的端点检测就是从含噪声的环境中检测出说话人的语音命令。由于每个人说话的语音特征是相对不变的,就可以利用语音信号的在特定时段内的能量和进行端点检测。语音信号的采样频率为8kHz(仅适合于简单语句的识别),样本区间为10ms,共80个采样点。每隔10ms计算一次短时能量和及过零点数。 (科教范文网 lw.nSeAc.com编辑发布)
n为一个样本区间语音的采样点数(80),A(k)为一维语音信号的离散函数,W(k)为窗函数。当采样得到的短时能量和大于一定阈值时,就认定此时语音已经开始。只要短时能量和低于平均能量的1/20就可以认定此时已经是语音信号的终点了。
4.3.1语音特征参数的提取和计算
输入的模拟语音信号首先通过TLC320AD50C内的抗混迭滤波器,然后由TLC320AD50C内的ADC采样和量化,接下来很重要的一环就是特征参数的提取。
对特征参数的要求:能有效地代表语音特征,且具有很好的区分性;各阶参数之间有良好的独立性;以及特征参数要计算方便等,以保证语音识别的实时实现。本系统选择线性预测倒谱系数(LPCC)作为语音识别的参数。线性预测编码(LPC)[3]是目前众多特征提取方法中的一种, 主要特点是运算简单,易于实现代码的优化,运算速度快。
定义线性预测模型为:
S(n)=∑a,s(n-i),(s(n)
为输入信号的Z变换)则其中a1~am即为系统所求的特征矢量。该系统为每样本区间信号计算出12阶LPCC系数,加上短时能量和作为以后的识别参数。以上算法是用TMS320VC5402的汇编语言实现的定点算法,可以在560μs内完成,满足系统实时性的需求。
其一、语音的压缩编码与解码
本系统对语音信号采用8 kHz采样频率,精度为16b,数据传输率为128 kb/s的方式处理。因而采用ADPCM算法[4]实现对语音的编码和解码非常方便,IMA-ADPCM(ADPCM,Adaptive Differential Pulse Code Modulation),是一种针对16b声音波形数据的一种有损压缩算法,他将声音流中每次采样的16b数据以4b存储,所以压缩比为1∶4。而压缩/解压缩算法非常的简单,所以是一种低空间消耗,高质量声音获得的好途径。将采集到的语音样本压缩到32 kb/s,可以保持清晰的音质,同时大大降低存储需求。 (科教作文网http://zw.NSEaC.com编辑发布)
其二、参数模板的管理
经上述处理后的语音参数和ADPCM编码保存在芯片AT29C020当中,芯片AT29C020为ATM公司生产的一款2-megabit 256k×8b的Flash Memory,是非易失存储器。这样做的目的是为了使系统能脱离PC机独立工作。为了合理利用这有限的存储资源,同时实现快速的模板搜索,采用以扇区为单位的管理系统,每扇区的格式固定,采用了顺序表的方法进行管理。
4.3.2模式识别动态时间归整
本系统采用动态时间归整(D