论文首页哲学论文经济论文法学论文教育论文文学论文历史论文理学论文工学论文医学论文管理论文艺术论文 |
语音压缩编码率类型
SACM_A200016KBits/s、20KBits/s、24KBits/sSACM_S4804.8KBits/s、7.2KBits/sSACM_S2402.4KBits/s这三种压缩算法的区别在于压缩率不同、音质也不同。SACM_A2000压缩率相对较小,音质较好,相应的资源占用较多。SACM_S240的压缩率最大,音质相对较差。SACM_S480介于这两者之间。每种算法都有完整的库函数供程序调用,软件编写非常方便。本语音遥控器采用SACM_S480算法。
语音识别分为特定发音人识别(Speaker Dependent)和非特定发音人识别(Speaker Independent)两种方式。
特定发音人识别是指语音样板由单个人训练,对训练人的语音命令识别准确率较高,而其他人的语音命令识别准确率较低或不识别。非特定发音人识别是指语音样板由不同年龄、不同性别、不同口音的人进行训练,可以识别一群人的命令。语音样板的提取非常重要。语音遥控器就是采用非特定发音人识别方式。
语音识别分为语音样板训练和语音识别两个过程。我们将标准模式的存储空间称之为“词库”,而把标准模式称之为“样板”。所谓语音样板训练,就是将待识别的命令进行频谱分析,提取特征参数作为识别的标准模式。语音识别的过程就是提取语音命令的