论文首页哲学论文经济论文法学论文教育论文文学论文历史论文理学论文工学论文医学论文管理论文艺术论文 |
二、 感知编码原理
1 、理论基础——闻域和临界频段
音频压缩理论是建立在心理声学模型基础上,从研究人耳的听感系统开始的。
人耳实际上可看成一个多频段的听感分析器,在接收端的最后,它对瞬间的频谱功率进行了重新分配,这就为音频的数据压缩提供了依据。
众所周知,声源振动的能量通过声波传入人耳,使耳膜发生振动,人们就产生了声音的感觉。但是人耳能听到的振动频率约在 20 Hz 到 20KHz 之间,低于 20 Hz 或高于 20K Hz 的振动,不能引起人类听觉器官的感觉。心理声学模型中一个基本的概念就是听觉系统中存在一个听觉阈值电平,低于这个电平的声音信号就听不到,因此就可以把这部分信号去掉。听觉阈值的大小随声音频率的改变而改变,各个人的听觉阈值也不同。大多数人的听觉系统对 2kHz ~ 5kHz 之间的声音最敏感。一个人是否能听到声音取决于声音的频率,以及声音的幅度是否高于这种频率下的听觉阈值。 这就是说在听觉阈值以外的电平可以去掉,相当于压缩了数据。另外, 听觉阈值电平是自适应的,即听觉阈值电平会随听到的不同频率的声音而发生变化。也许你有这样的体验,在一安静房间里的普通谈话可以听得很清楚,但在播放摇滚乐的环境下同样的普通谈话就听不清楚了。声音压缩算法也同样可以确立这种特性的模型来取消更多的冗余数据。