| 论文导读:目前最新的视频编码标准H.264/AVC。编码帧内预测模式所需的比特在总码流中占较大的比重。并用率失真优化函数在其中择优。一种快速帧内预测算法。关键词:H.264/AVC,帧内预测,编码效率,率失真优化
 
 1 引言 目前最新的视频编码标准H.264/AVC[1]是由国际电信联盟(ITU-T)的视频编码专家组(VCEG)和国际标准化组织(ISO/IEC)的运动图像专家组(MPEG)建立的联合视频工作组(JVT)联合制定的。在H.264/AVC标准中,为了获得高视频质量和高压缩比,采用率失真优化 RDO (rate distortion optimization) 模型[2,3]选择帧内预测模式,但帧内预测模式选择算法的高计算复杂度是制约H.264/AVC实际应用的主要因素之一。帧内预测模式选择的改进算法研究,成为近年来国内外研究的热点。毕业论文,H.264/AVC。现有的帧内预测模式选择优化算法,大体可分为2类:1) 简化 RDO代价函数[4];2)通过概率预测及阈值判断来减少候选模式[5-7]。其中第2类方法吸引了更多研究者的关注。然而这些方法在提高编码速度的同时,编码性能都有所下降。 本文对多种序列的帧内编码中各种预测模式所占比重进行统计,并基于统计结果提出了一种单向直接预测与多方向预测相结合的自适应算法。该算法对用于预测的参考像素进行相似度判断,在参考像素相似度高时,直接使用DC预测模式进行预测,除了能省略编码H.264/AVC中传统的9种预测模式所需要的比特,还节省了传统方法中需要进行的在9种模式之间进行择优的运算过程。从而,在提高编码性能的同时,减少了计算复杂度。 2 H.264/AVC帧内编码过程 H.264/AVC使用帧内预测编码技术以降低邻近宏块之间的空间相关性,它定义了9种4×4亮度块预测模式,4种16×16亮度块预测模式。编码端采用率失真优化模式判决方法选择最佳的帧内预测模式。本文主要针对H.264/AVC中4×4亮度块的帧内预测编码进行研究。4×4亮度的预模式除平均模式(模式2)以外,还有其它8种模式,它们具有不同的预测方向。图1显示了这8种模式的预测方向。 对于一个4×4块而言,它需要用1个或4个比特表示编码模式。在一个宏块中,共有16个4×4子块,共需要16到64个比特来表示编码模式。毕业论文,H.264/AVC。在低码率视频编码应用系统中,编码帧内预测模式所需的比特在总码流中占较大的比重。同时,遍历H.264/AVC所定义的全部预测模式,并用率失真优化函数在其中择优,需要较大的计算量。为了减少表示编码模式所需的码率,并提高编码速度,我们提出利用参考像素的相似度来决定是否直接进行平均模式的预测编码。 3 基于参考像素相似度检测的帧内预测编码 图2为4×4待预测子块及其参考像素,其中 为待预测像素,  为相邻块中的参考像素。从预测原理可知,当所有的参考像素  都相同时,使用9种预测模式所得的预测值都相同。在这种情况下,使用这些模式进行预测所得到的残差也相同。当  不完全相同但非常近似时,考虑到量化步骤会将比较相近的残差值量化为相同的值,我们也可以得出同样的结论。因此,在上述情况下,我们默认使用一种固定的预测模式进行预测,不但可以省略标识预测模式所需要的码流,还可以省略其余8种预测所进行的率失真决策计算量。   
 图1. 4×4亮度块的帧内预测模式图2.预测块及其参考像素 为了确定默认模式,我们选取多个CIF序列,对不同序列中各个预测模式的分布情况进行了统计分析,如表1所示。从表1可以得知,垂直、水平以及DC三种模式之和占所有预测模式的60%以上,其中DC模式占的比重最大。毕业论文,H.264/AVC。毕业论文,H.264/AVC。因此,为了适应参考像素比较相似的纹理特性,我们选择DC模式作为默认模式。 表1 帧内预测各模式所占比重   
    
        
            | 模式序号 | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 |  
            | 平均比重 | 13.54% | 22.59% | 29.11% | 3.93% | 6.35% | 4.41% | 6.27% | 4.33% | 9.47% |  像素相似度由式(1)所示的公式计算得到,其中lk是参考像素,ml是参考像素的均值,  为参考像素的相似度。式(2)所示的  为参考像素相似度的阈值,由量化参数  确定。当参考像素相似度小于对应的阈值时,则判断当前子块的像素为相似的,此时按照默认模式进行编码,否则按照H.264/AVC的正常方式进行编码。算法流程如图3所示。  (1)
  (2)
 
 图3. 基于参考像素相似度检测的帧内预测流程 4 实验结果分析为验证所提算法的有效性,将算法集成到 H.264/AVC的参考模型 JM16.1[8]中,在全I帧结构下,对5个CIF格式的序列进行实验。使用率失真优化,测试QP点为22,27,32,37,每个序列各测试100帧,采用文献[9]中的方法来计算编码性能,实验结果如表2所示。 表2 实验结果   
    
        
            | Sequence | △Bit-Rate(%) | △PSNR(dB) | Time saving (%) |  
            | CIF | Paris | -1.81 | 0.13 | 42.1 |  
            | Foreman | -2.26 | 0.21 | 39.7 |  
            | News | -0.58 | 0.05 | 19.6 |  
            | Bus | -0.97 | 0.07 | 26.8 |  
            | Mobile | -1.04 | 0.08 | 22.5 |  
            | Average for CIF | -1.33 | 0.11 | 30.1 |  从表2可以看出,和H.264/AVC中的方法相比,所提方法能取得平均超过1.3%的码率减少,并且编码时间能平均节省约30%。这说明所提方法能充分利用视频序列自身的纹理特性,在减少编码时间的同时,能在一定程度上提高帧内编码的增益。毕业论文,H.264/AVC。 5 结论 为进一步提高帧内预测的编码性能,本文对用于预测的参考像素进行相似度检测,当参考像素相似度高时,直接使用平均模式预测,省略了用于编码预测模式的比特,节省了码率,并减少了用于率失真优化所需的计算量,降低了计算复杂度;在各参考像素差异较大时,则按H.264/AVC中率失真优化的方法进行模式选择。毕业论文,H.264/AVC。实验结果表明,在减少编码时间的同时,能在一定程度上提高帧内编码的增益。 参考文献[1]Richardson IEG. H.264 and MPEG-4 Video Compression[M]. England: John Wiley & Sons Ltd, 2004: 159-164.
 [2]Ortega A, RamchandranK. Rate-distortion methods for image and video compression[J]. IEEE SignalProcessing Magazine, 1998, 15: 23-50.
 [3]WIEGAND T, GIROD B. Lagrange multiplier selectionin hybrid video coder control[A]. IEEE International Conference on ImageProcessing[C], 2001: 542-545.
 [4]HUANG Yuan, HSIEH B Y, CHEN T C, et al. Analysisfast algorithm and VLSI architecture design for H.264/ AVC intra frame coder[J].IEEE Transactions on Circuits and Systems for Video Technology, 2005, 15(3):378-401.
 [5]PAN F, LIN X, RAHARDJA S, et al. Fast ModeDecision for Intra Prediction[R]. JVT 7th Meeting Pattaya, Thailand, Doc. JVT-G013, 2003.
 [6]PAN F, LIN X, RAHARDJA S, et al. Fast modedecision algorithm for intraprediction in H.264/AVC video[J]. Coding Circuitsand Systems For Video Technology, IEEE Transactions, 2005, 15(7): 813-822.
 [7]WANG J, WANG J, CHEN J, et al. A novel fastalgorithm for intra mode decision in H.264/AVC encoders[A]. Proceedings of theIEEE International Symposium[C], 2006: 3498-3501.
 [8]H.264/AVC ReferenceSoftware JM 16.1[CP]. http://iphome.hhi.de/suehring/tml/download/old_jm/jm16.1.zip,2009.
 [9]Gisle Bjontegarrd. Calculation of Average PSNRDifferences between RD curves[R], ITU-T SG16/Q6, Doc. VCEG- M33, 2001.
 
   |