计算科学与人工智能分享 http://blog.sciencenet.cn/u/kinglandom 专注计算科学与人工智能的进展、原理及实现。

博文

基于H.264的码率控制的改进方法研究

已有 5844 次阅读 2008-10-24 10:23 |个人分类:思想碰撞| 码率控制, R-D模型, MAD模型, 比特率分配

基于H.264的码率控制的改进方法研究
摘要:码率控制是H.264中的一个重要的组成部分,其目标是在特定的条件下调整编码后的码流来满足的实际需求。最佳的码率控制由合适的比特分配和精准的比特率控制所共同决定。首先阐述了H.264中的码率控制方法及其要解决的问题,然后对JVT关于H.264中码率控制的几个重要提案进行了深入分析,在此基础上结合现阶段的一些研究成果讨论了H.264码率控制改进方法。
关键词:H.264;码率控制;R-D模型;MAD模型;比特率分配
中图分类号:TN919.8
 Method improvements of rate control based on H.264
(1. School of Information Engineering , Zhejiang University of Technology , Hangzhou 310032,China;2. Nanjing University of Posts and Telecommunications,Nanjing 210003,China)
Abstract: Rate control is one of most important part of H.264,the objective of rate control is to regulate the coded bit stream to satisfy certain given conditions.Optimal rate control can be achieved jointly by optimum bit allocation and accurate bit rate control.Firstly,give a study on rate control which based on H.264 and the problems that it is faced with. Then discusses the method improvements of rate control based on H.264 through analysising several important resolutions about rate control of H.264 which have been proposed by JVT and studying the popular research findings of it.
Key words: H.264; rate control; R-D model; MAD model; bit allocation
____________________
收稿日期:2007-12-13
 
0引 言
      H.264是联合视频专家组(Jiont Vedio Team,JVT )制定的关于视频编码的新标准,它在吸取了以往标准的优点的同时又增加了自己的一些新特点,如统一视频编码层的符号编码,高精度、多模式的位估计,基于4×4的整数变换,以及分层的编码语法等。这使得H.264的算法具有很高的编码效率,在相同的重建图像质量下,能够比H.263节约50%左右的比特率。
若没有码率控制任何视频编码都难以在实际中获得应用,因此,针对不同的标准和用途,这就使得作为视频编码的关键技术之一的码率控制技术成为目前研究的热点。事实上,由于H.264标准里仅规定了编解码器的码流结构而并没有规定编码的具体细节,这给码率控制的优化工作带来了极大的便利,同时由于H.264标准的主要精力集中在编码码流及解码方法上,而并没有很好地研究码率控制,这预示着H.264的码率控制部分有着潜在的较大提升空间的余地。
       码率控制任务就是通过调节量化参数,使图像序列的比特率尽可能地与目标比特率一致,同时在保证缓冲比特占有度稳定的前提下,尽量保证图像质量的稳定。考虑到H.264引入了率失真优化控制(Rate Distortion Optimization,RDO)进行模式选择,量化参数(Quantization Parameter,QP)同时使用于率失真优化和码率控制之中,也就导致了著名的“鸡蛋”悖论:为了计算当前的QP需要当前宏块的运动估计残差,而运动估计残差只有在率失真优化之后才能得到,如果用预测帧与当前帧的平均绝对误差(Meam Absolute Different,MAD)来表示运动估计残差。
      笔者首先对目前JVT关于H.264的三个重要提案作了必要的分析,然后在此基础上研究了现阶段部分学者所提出的改进方法,最后为H.264的码率控制的总结及对H.264码率控制的改进方法进行了展望。
1JVT重要提案的分析
1.1 JVT-D030
该提案主要分为以下几个步骤:(a) 比特分配(b)第一次RDO(c)确定量化参数(d)第二次RDO。
      显然,在JVT-D030中,解决“鸡蛋”悖论的方法是采用二次编码的方案,这样就极大地增加了编码的复杂度,这也是该方案难以应用于实时传输中的主要原因。JVT-D030中对于帧复杂度的估计与该帧类型有关,且不同类型的帧分别设有独立的虚拟缓存,这样就再度增加了它的编码复杂度。同时,由于它的率失真模型过于简单,这就难以得到的精确的码率控制。
1.2 JVT-G012
      由于JVT-D030中的上述不足, JVT-G012 就取代JVT-D030成为H.264的标准码率控制的方法。在JVT-G012中,通过利用了图像的时空的相关性取代二次编码来解决“鸡蛋”悖论,即用线性MAD模型来估计帧的复杂度,用MPEG-4的二次R-D(Quadratic Rate Distortion)模型来计算量化参数,同时JVT-G012中提出了宏块单元的概念,其可以是帧、片或宏块。该提案的主要步骤如下:(a)目标比特分配 (b) 预测MAD (c)用二次R-D模型计算QP (d)执行RDO。
     JVT-G012中目标比特率的分配方案是把剩余的比特数平均分配给未编码的帧,而没有根据具体帧的复杂度,MAD是作为帧的复杂度用来解决“鸡蛋”悖论的,它的值是根据已编码的帧通过线性预测得到,在得到目标比特数与MAD后,用二次R-D模型计算QP,最后利用所得到的QP进行RDO模式选择。
      然而,JVT-G012并没有充分利用图像的时空相关性:首先,在MAD线性预测模型上,它运用于所有的宏块预测,但是对于空间较远的宏块而言,其空间相关性就很小,这样预测所得到的数据就不准确。其次,R-D模型上,由于JVT-G012采用了文献[3]中的MPEG-4 Q2模型,采用线性回归分析进行参数更新,其数据是在最近的编码块中得到,只适用于同一帧,这样只能得到空间的相关性;这显然是不够的,因为在实际的编码中,没有空间相关性或者空间相关性较弱但时间相关性较强的经常发生。所以在预测得到的图像复杂度还不能充分反映图像的特征;而且,该方程只适用于MAD值较大的情况,当MAD值较小时,采用用此模型得到的效果就不够精确。
1.3 JVT-O016
      JVT-O016继承JVT-G012的传统算法,针对的上述不足,JVT-O016把主要方向锁定为充分挖掘图像序列的时空相关性,侧重点放在RDO模型的改进上:
(1) R-D模型:将JVT-G012中采用的二次R-D模型在当前帧量化步长的中值点用泰勒级数展开,利用在同一帧中量化步长变化小的特点得到新的R-D模型。
(2) 失真模型:认为与图像内容一样,失真也存在时空相关性,所以相邻的宏块的失真分布是相似的。基于这种思想,有效了利用图像的时空相关性导出新的线性失真预测模型。  
(3) 率失真优化模型:基于上述新的R-D模型和失真模型,利用拉格朗日优化算法得到一种新的率失真优化模型。
2码率控制的改进方法
      由于H.264采用了多种改进编码效率的技术,对于码率控制,针对不同的应用可以选择不同的技术,其码率控制模型的建立也应该结合实际应用做出调整。
       码率控制改进的目标主要有:提高输出码率控制精度使其能够最大程度的接近目标码率;提高编码后输出比特流的峰值信噪比(Peak Signal to Noise Ratio,PSNR),减少其波动;提高运算速度,使其能够在实时条件下能够得到应用。
      笔者主要从下面的三个方面讨论码率控制的改进并进行了详细分析:
(1) 改进目标比特率的分配。
(2) 为更好地解决“鸡蛋”悖论,改进MAD模型。
(3) 改进R-D模型。
2.1 分配目标比特率的改进
      上述提案中,目标比特率的分配仅由缓存占有度决定,并且将GOP中剩余的比特数平均分配给了该GOP中未编码的所有帧,这样如果缓存占有度较高时,新帧就会分配较少的比特数,这样很可能引起跳帧和信噪比下降,从而可能使一个视频序列的不一致性失真,最后引起视频的不连贯性,这在急剧变化或场景切换的情况下更加明显。而实际上由于序列的运动性,帧间的差异有时是很显著的,所以在进行帧级目标比特率估计时,需要考虑帧内帧间的复杂度,使得码率控制性能够得到提高,因此结合图像本身的复杂性来优化码率分配成为改进算法性能的一种有效方法。这类算法可利用图像时空相关性,以MAD,信号的能量,PSNR和图像的直方图等不同形式作为图像复杂性的度量参数,用于调整剩余比特的分配。基于这种思想,文献[6]提出按能量大小对宏块进行比特分配,最后指出这种方法能够得到较好编码效果,文献[7]则用差分序列直方图(Histogram of Diferential sequence,HOD)来表示图像的复杂度进行比特分配,且该文献指出HOD能很好的反映图像的复杂度,并且具有较低的计算复杂度。
      这种方法的优点在于它不改变现有H.264码率控制算法的整体框架,对编码计算复杂度影响不大.......
以下文章内容作者省略
参考文献
[1] MA Siwei, GAO Wen, and LU Yan. rate control on JVT standard JVT-D030[C]. 4th Meeting, Klagenfurt, Austria, 2002, 22 (7).
[2] LI Zhengguo, PAN Feng, Keng Pang Lim, FENG Genan, LIN Xiao and Susanto Rahardja .Adaptive basic unit layer rate control for JVT[C].7th meeting, Pattaya II, Thailand, 2003,17(3).
[3] Tihao Chiang and ZhANG Yaqin.A new rate control scheme using quadratic rate distortion model[J]. IEEE Transaction On Circuits And Systems For Video Technology, 1997(2) :246-250.
[4] WU Yuan,LIN Shouxun, ZHANG Yongdong, et al.Optimum bit allocation and rate control for H.264/AVC[C]. 15th Meeting, Busan,KR,2005: 16-22.
[5] XU Jianfeng, HE Yun. A novel rate control for H.264.IEEE Transactions On Image Processing[J].2004 23(5): 809-812.
[6] WANG Ning, HE Yun.A new bitrate control strategy for H.264[J]. IEEE Transactions on Signal Processing, 2003,15(12):1370-1374.
[7] Lee Jungwoo,Dickinson Bradley W. Temporally adaptive motion interpolation exploting temporal masking in visual perception [J].IEE Transactions on Image Processing,1994,3(5):513-526.
[8] JIANG Minqiang,YI Xiaoquan and LING Nam.Improved frame-layer rate control for H.264 using MAD ratio[J]. Circuits and Systems ISCAS apos, 2004,23(5): 813-816.
[9] LIN Wanrong et al .Bit number prediction for VLC coded DCT coefficients and its application in DV encoding transcoding[J]. Multimedia Signal Processing , IEEE Fourth Workshop on , 2001,3 (10) :135 – 140.
[10] Shinih,Leeyh,Parkhw.Rate control using linear rate-ρ model for H.264[J]. signal Processing On Image Communication, 2004, 4: 314-352.
[11] Yucel Altunbasak and Nejat Kamaci.An analysis of the DCT coefficent distribution with the H.264[J]. IEEE International Conference 2004,17(5): 177-180.
 


https://blog.sciencenet.cn/blog-85556-43825.html

上一篇:MIMO技术的应用
下一篇:HT1便携式码流分析仪
收藏 IP: .*| 热度|

1 阮汉强

发表评论 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-25 14:10

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部