论文首页哲学论文经济论文法学论文教育论文文学论文历史论文理学论文工学论文医学论文管理论文艺术论文 |
2.2 基于深度信息的视频编码(V+D)
传统立体视频系统通过模拟人类视觉的二目成像原理获得深度信息,在基于深度信息的视频编码(Video+Depth)系统中,解码端接收到一个普通的色彩图像和一个像素深度信息图后,根据深度信息图重新生成立体图像对。深度信息图可以看作一个单色的亮度图像,每个像素的深度数值被限定在最大值Zmax 和Zmin 之间,数值的大小代表相应物点到镜头的远近。一般深度值通过8 比特线性量化,即:用255 代表最近点,0 代表最远点,这样深度信息图完全可以视为一个灰度图像。
由于灰度图像比较平滑,图像边缘比较锐利,大概色彩图像10%~20%的比特速率就可以完成对灰度信息的编码。这种V+D 的编码方式比传统立体视频编码有更高的效率。V+D视频编码方式中的色彩图像可以直接在传统的2D 显示设备上播放,具有良好的后向兼容性。
多年来业界一致认为,对某些3D 视频业务(如3DTV)而言,良好的后向兼容性是关系到3D 视频业务能否大规模应用的关键。V+D 方式实现了高压缩率,后向兼容性及更优秀的3D视频显示功能,是很被看好的3D 视频编码方法。
V+D 作为目前3D 视频编码的研究热点,已经有了很多成熟的算法。这些算法大都利用了深度信息图像的特征,有的还考虑到了色彩图像和深度图像的相关性等。 (科教作文网http://zw.NSEaC.com编辑发布)
V+D 系统最终显示的3D 视频是由色彩图像和深度图像共同恢复出来的,通过观察得知,深度图像质量的小幅下降并不会显著影响所恢复的3D 视频质量,因此可以在编码过程中使用较低分辨率的深度图像,由于解码端需要原始分辨率的深度信息图像,人们提出了所谓的DSUS 算法,即在编码前对深度信息图像下采样,解码之前进行上采样,这种DSUS算法比直接用较低分辨率进行编码取得更好的视频图像质量。
由于色彩图像和深度图的像是用来描述同一个视频场景的内容的,色彩图像包含了颜色表面结构等纹理信息,而深度描述每个像素点相对摄像机的位置。因此有人认为在色彩图像和深度图像中的物体运动情况是一致的,可以把色彩图像的运动矢量运用到深度图像中,实现色彩和深度图像共用运动矢量。研究结果证明通过一系列3D 宏块的匹配算法可以实现码率的降低,但同时也增加了计算的复杂度,使用这种共用运动矢量的算法,需要在码率降低和运算复杂度提高之间做个折中。
这种 V+D 的编码方式在实际应用中也有一定困难,目前存在的最大问题是V+D 视频的生成质量不高。虽然当前市场上有了可以自动获取图像深度的摄像机,但是摄像机获取图像深度信息的能力依然非常有限,深度预测算法也有许多改进的空间。考虑到深度预测差值对3D 视频恢复有很大影响,改进的算法一般都会牺牲编码效率,因此非常有必要开发一套完全自动的,准确,可靠的视频深度获取系统。可以说,提高V+D 视频的获取质量是扩大该编码方式应用范围的关键所在。
2.3 多视角视频编码(MVC)