转： X264码率控制总结1——ABR,CQP,CRF

时间 2019-12-25

标签 x264 控制总结 abr cqp crf 繁體版

原文原文链接

1.  X264显式支持的一趟码率控制方法有：ABR, CQP, CRF. 缺省方法是CRF。这三种方式的优先级是ABR > CQP > CRF.

[cpp] view plain copy 算法

if ( bitrate ) rc_method = ABR;
else if ( qp || qp_constant ) rc_method = CQP;
else rc_method = CRF;

bitrate和QP都没有缺省值，一旦设置他们就表示要按照相应的码率控制方法进行编码，CRF有缺省值23，没有任何关于编码控制的设置时就按照CRF缺省值23来编码。通常的使用建议： CQP – 通常不推荐使用，在一些算法验证工做中会使用这种模式 CRF – 适合在关注一遍编码质量而输出文件大小或码率不是太紧要的场景下使用，通常网络压片使用CRF。 1 pass ABR – 适用于流媒体或者目标码率受限的实时应用场景。 2 pass VBR – 适用于有目标码率限制而又有时间能够进行二次编码的非实时应用。网络

2. CQP，恒定QP. 完好省值
        最简单的码率控制方式，每帧图像都按照一个特定的QP来编码，每帧编码后的数据量有多大是未知的。

        参数qp_constant设置的是P帧的QP。I,B帧的QP根据f_ip_factor， f_pb_factor，计算获得。

[cpp] view plain copy app

rc->ip_offset = 6.0 * log2f( h->param.rc.f_ip_factor );
rc->pb_offset = 6.0 * log2f( h->param.rc.f_pb_factor );
rc->qp_constant[SLICE_TYPE_P] = h->param.rc.i_qp_constant;
rc->qp_constant[SLICE_TYPE_I] = x264_clip3( h->param.rc.i_qp_constant - rc->ip_offset + 0.5, 0, QP_MAX );
rc->qp_constant[SLICE_TYPE_B] = x264_clip3( h->param.rc.i_qp_constant + rc->pb_offset + 0.5, 0, QP_MAX );

连续多个B帧时，QP会渐增。 x264 YUV420格式 8比特采样的QP范围是[0, 51]。QP值越小，编码视觉质量越好。QP=0为无失真编码。less

        在研究编码算法的时候，通常会选用CQP方法，设定QP为24，28，32，36，40等（通常选4个QP值），编码获得RD曲线，而后比较算法优劣。

        相同视觉质量时，CQP编码输出的文件会比CRF模式更大。通常而言CRF都能代替CQP方法，不过CQP由于彻底不须要预测因此它会运行得更快一些。

        帧的重要级别为：IDR帧 > I帧 > P帧 > 作参考的B帧 > 不作参考的B帧。QP能够依次增大。

       QPmin，默认值: 0。定义X264可使用的最小量化值。量化值越小，输出视频质量就越好。
               当QP小于某一个值后，编码输出的宏块质量与原始块极为相近，这时不必继续下降QP。
               若是开启了自适应量化器（默认开启），不建议提升QPmin的值，由于这会下降平滑背景区域的视觉质量。

       QPmax，默认值: 51。定义X264可使用的最大量化值。默认值51是H.264规格中可供使用的最大量化值。
               若是想要控制X264输出的最低品质，能够将此值设置的小一些。
               QPmin和QPmax在CRF，ABR方法下是有效的，太低的设置QPmax，可能形成ABR码率控制失败。不建议调整这个参数。

       QPstep，默认值: 4。设置两帧间量化值的最大变化幅度。

       帧间QP变化，帧内宏块QP不变，输出码率未知，各帧输出视觉质量有变化（高QP低码率的状况下会更明显）。

3. CRF，恒定Rate Factor （码率系数）缺省值23
       CQP是把某个量化值做为目标，bitrate是把某个输出文件大小做为目标，而CRF则是把某个输出“视觉质量”做为目标。

       CRF能够提供跟QP同样的视觉质量，可是文件更小，CRF是经过下降那些“less important”帧的质量来达到此目的的。

       “less important”的意思是那些过于耗费码率又难以用肉眼察觉的帧，好比复杂或者高速运行的场景。省下来的码率会分配给其它更有效的帧。

       在X264编码器内部CRF和bitrate采用了相同的调整策略，只是它不遵循一个特定的输出码率。

       它也是经过改变不一样重要级别帧（I,P,B类型），以及帧内不一样宏块类型（高速运动，复杂纹理，平坦区域）的QP值，以此来调整输出视觉质量。

       和QP的范围同样RF的范围也是[0, 51]。其中0为无损模式，23为缺省，51质量最差。和QP同样的趋势。RF值加6，输出码率大概减小一半；减6，输出码率翻倍。

       从主观上讲，18~28是一个合理的范围，18每每被认为从视觉上看是近似无损的。

       帧间QP变化，帧内宏块QP变化，输出码率未知，各帧输出视觉质量基本恒定。

4. ABR, 恒定平均目标码率。想要选择这种码率控制方法，必须先设置bitrate。
       X264中bitrate的单位是Kbps(K bit per second). --bitrate 128指的是设置目标码率为128Kbps, 这样一秒钟的数据量为 128/8比特 = 16K字节。

   若是输入为352x288@15fps，至关于128Kbit/(352*288*15) = 0.086比特每像素。编码后每一个像素平均分配不到0.1个比特。

与ABR相应的技术有CBR,VBR。这些码率控制技术首先都是在音频编码中采用，是解决音频编码采用什么样的比特率最优的问题。

CBR编码码比特率基本保持恒定在目标比特率，有利于流式播放。 CBR的缺点在于复杂场景码率不够用，简单场景码率浪费，所以编码内容的视觉质量不稳定。一般在较低比特率下，这种质量的变化会更加明显。优化

VBR编码为简单场景分配较大的QP，为复杂的场景分配较小的QP，获得基本稳定的输出视觉质量。相对于CBR，在相同文件大小的条件下，VBR的输出结果要比CBR好的多，这有利于媒体下载和本地存储。 VBR的缺点在于输出码流大小不可控。同时对于复杂度恒定的内容（例如新闻播音）没什么优点。ui

ABR编码为简单场景分配较少的比特，从而留出足量的比特用于生成高质量的复杂部分。使得有限的比特数可以在不一样的场景间合理分配，这相似于VBR。同时ABR分配码率，使得在必定时间内，平均码率趋近于目标码率，这样能够控制输出文件大小，这点相似于CBR。所以能够认为ABR是CBR和VBR的一种折中优化方案。编码

分析视频编码码率控制能够经过三个因素：
       1. 视觉质量稳定性，利于视觉主观质量；
       2. 即时输出码率，至关于每帧编码输出比特数；
       3. 输出视频文件大小可控，利于传输，存储。
       比较这三种码率控制方式以下：
       #        视觉质量稳定性         即时输出码率        输出文件大小
       CBR          不稳定               恒定               可控
       VBR           稳定                变化              不可控
       ABR         基本稳定               变化               可控 （即时码率变化，但一段时期内平均码率趋近目标码率）

在当前X264版本中（version 142），选用ABR须要注意两个设置，1.fps；2.输出帧pts计算。

1. fps。ABR会根据帧率来估算每帧的平均数据量，bitrate/fps为平均一帧数据量。

当输入视频源为YUV数据，须要显式的指定正确的帧率--fps，不然X264会用缺省的25fps来计算，有可能控制不到设定的目标码率。

2. pts计算。ABR算法中用到不一样帧的pts做为帧间距离，若是没有设置输出帧的pts值，X264会报“non-strictly-monotonic PTS”警告。
          编码出来的视频文件码率很小，根本达不到bitrate的设置，同时视频质量不好，几乎都为马赛克。两种方法解决这个问题：
          a. 设置param.b_vfr_input = 0，这时用fps而不是timebase,timestamps来计算帧间距离
          b. 在解码后主动更新pts, pic_out.i_pts++;
         这两种方式均可以免ABR码率控制失效的问题。