免费毕业论文--智能语音识别遥控系统(一)信(5)

2013-06-11 01:06

导读：P芯片。其主要特点包括：采用改进的哈佛结构，1条程序总线(PB)，3条数据总线(CB，DB，EB)和4条地址总线(PAB，CAB，DAB，EAB)，带有专用硬件逻辑CPU(40b算术逻

P芯片。其主要特点包括：采用改进的哈佛结构，1条程序总线(PB)，3条数据总线(CB，DB，EB)和4条地址总线(PAB，CAB，DAB，EAB)，带有专用硬件逻辑CPU(40b算术逻辑单元(ALU)，包括一个40b桶形移位器和2个40b累加器；一个17×17乘法器和一个40b专用加法器，允许16b带或不带符号的乘法)，片内存储器(8个辅助寄存器及一个软件栈)，片内外专用的指令集，允许使用业界最先进的定点DSPC语言编译器。TMS320VC5402含4 kB的片内ROM和16kB的双存取 RAM，1个HPI(HostPortInterface)接口，2个多通道缓冲单口MCBSP(Multi-Channel Buffered Serial Port),单周期指令执行时间10ns，带有符合IEEE1149.1标准的JTAG边界扫描仿真逻辑。
　　TMS320VC5402采用双电源(1.8V和3.3V)供电，其中I/O采用3.3V电源供电，芯片的核采用1.8V电源供电。由于实际系统使用5 V电源，所以必须采用电源转换芯片。选用TPS7301和TPS7333两块电源转换芯片(他们都是TI公司为配合DSP而设计的电源转换芯片)，分别接上少量的外围电路，即可调整两块芯片的输出电压分别为3.3V和1.8V。
4.2.1语音输入输出模拟前端的选择
TLC320AD50C是TI公司生产的一款集成ADC和DAC于一体的模拟接口电路，并且与DSP接口简单，高性能，低功耗，已成为当前语音处理的主流产品。16b数据结构、音频范围(采样频率为2～22.05kHz)、内含抗混叠滤波器和重构滤波器的模拟接口芯片，他有一个能与许多DSP芯片相连的同步串行通信接口。TLC320AD50C片内还包括一个定时器(调整采样率和帧同步延时)和控制器(调整编程放大增益、锁相环PLL、主从模式)。TLC320AD50C有28脚的塑料SOP封装(带DW后缀)和48脚的塑料扁平封装(带PT后缀)，体积较小，适应于便携设备。
TLC320AD50C的工作温度范围是0～70℃，单一5V电源供电或5V和3.2 V联合供电，工作时的最大功耗为120mW。TLC320AD50CTMS320VC5402的硬件连接如图4-2所示。

图4-2 TLC320AD50C与TMS320VC5402硬件连接（转载自http://zw.NSEAC.com科教作文网）
①外挂程序存储单元　采用一片27C512作为程序存储器，系统复位后，程序自动由EPROM中加载进入DSP的片内程序存储区运行。
②语音模板存储单元　采用一片AT29C020作为模板和语音存储器，通过BDMA接口与TMS320VC5402相连。
③系统复位与电源适配　电源复位、适配和监视电路由MAX705，TPS7301和TPS7333实现。
另外，采用74HC574做输出识别接口，这就构成了基本的语音识别模块。加上键盘、LCD显示接口和相应的译码电路，即可构成完整的控制器。
4.2.2接口设计
①TMS320VC5402串口的初始化　首先将DSP串口1复位，再对串口1的16个寄存器进行编程，使DSP串口工作在以下状态：以SPI模式运行，每帧一段，每段一个字，每字16b，采样率发生器由DSP内部产生，帧同步信号和移位时钟信号由外部产生。DSP给AD50C编程用查询方式，接收A/D转换的D信号和发送D/A转换的D信号用DMA方式。
②TLC320AD50C的初始化　首先由TMS320VC5402的同步串口发送两串16b数字信息到TLC320AD50C。第一串为0000 0000 0000 0001B，最低有效位(bits0＝1)说明下一个要传输的数据字属于二次通信[2]。第二个数据值用来对TLC320AD50C的4个数据寄存器的某一个进行配置。Bits15～11位为0，Bits10～8位为所选寄存器地址值，Bits7～0位为所选中寄存器的编程值。并且使TLC320AD50C工作在以下状态：选择INP/INM为工作模拟输入，15＋1位ADC和15＋1位DAC模式，采样频率为8 kHz，模拟信号输入和输出放大增益均为0dB。
4.3语音信号的端点检测
　　语音信号的端点检测就是从含噪声的环境中检测出说话人的语音命令。由于每个人说话的语音特征是相对不变的，就可以利用语音信号的在特定时段内的能量和进行端点检测。语音信号的采样频率为8kHz(仅适合于简单语句的识别)，样本区间为10ms，共80个采样点。每隔10ms计算一次短时能量和及过零点数。（科教范文网 lw.nSeAc.com编辑发布）
　　n为一个样本区间语音的采样点数(80)，A(k)为一维语音信号的离散函数，W(k)为窗函数。当采样得到的短时能量和大于一定阈值时，就认定此时语音已经开始。只要短时能量和低于平均能量的1/20就可以认定此时已经是语音信号的终点了。
4.3.1语音特征参数的提取和计算
　　输入的模拟语音信号首先通过TLC320AD50C内的抗混迭滤波器，然后由TLC320AD50C内的ADC采样和量化，接下来很重要的一环就是特征参数的提取。
　　对特征参数的要求：能有效地代表语音特征，且具有很好的区分性；各阶参数之间有良好的独立性；以及特征参数要计算方便等，以保证语音识别的实时实现。本系统选择线性预测倒谱系数(LPCC)作为语音识别的参数。线性预测编码(LPC)［3］是目前众多特征提取方法中的一种，主要特点是运算简单，易于实现代码的优化，运算速度快。
定义线性预测模型为:
S(n)=∑a,s(n-i),(s(n)
为输入信号的Z变换)则其中a1～am即为系统所求的特征矢量。该系统为每样本区间信号计算出12阶LPCC系数，加上短时能量和作为以后的识别参数。以上算法是用TMS320VC5402的汇编语言实现的定点算法，可以在560μs内完成，满足系统实时性的需求。
其一、语音的压缩编码与解码
本系统对语音信号采用8 kHz采样频率，精度为16b，数据传输率为128 kb/s的方式处理。因而采用ADPCM算法[4]实现对语音的编码和解码非常方便,IMA-ADPCM(ADPCM，Adaptive Differential Pulse Code Modulation)，是一种针对16b声音波形数据的一种有损压缩算法，他将声音流中每次采样的16b数据以4b存储，所以压缩比为1∶4。而压缩/解压缩算法非常的简单，所以是一种低空间消耗，高质量声音获得的好途径。将采集到的语音样本压缩到32 kb/s，可以保持清晰的音质，同时大大降低存储需求。（科教作文网http://zw.NSEaC.com编辑发布）
其二、参数模板的管理
经上述处理后的语音参数和ADPCM编码保存在芯片AT29C020当中，芯片AT29C020为ATM公司生产的一款2-megabit 256k×8b的Flash Memory，是非易失存储器。这样做的目的是为了使系统能脱离PC机独立工作。为了合理利用这有限的存储资源，同时实现快速的模板搜索，采用以扇区为单位的管理系统，每扇区的格式固定，采用了顺序表的方法进行管理。
4.3.2模式识别动态时间归整
本系统采用动态时间归整(D

上一篇：免费毕业论文-字密码锁设计(一)信息工程下一篇：没有了