Tone Mapping算法系列二：一种自适应对数映射的高对比度图像显示技术及其速度优化。

时间 2019-11-06

标签 tone mapping 算法系列一种自适应对数映射对比度图像显示技术及其速度优化栏目 CSS 繁體版

原文原文链接

　　办公室今天停电，幸亏本本还有电，同事们好多都去打麻将去了，话说麻将这东西玩起来也仍是有味的，不过我感受我是输了不舒服，赢了替输的人不舒服，因此干脆拜别麻坛四五年了，在办公室一我的整理下很久前的一片论文的思想，和万千世界里有缘人共同分享下资源了。算法

　　论文的名字是<Adaptive Logarithmic Mapping For Displaying High Contrast Scenes>，相关的PDF文档能够在百度上下载到，翻译成中文的意思是一种显示高对比度场景的自适应对数映射算法，也是一篇很古老的算法文章的，看了下好像是2003年的，在Opencv 3.0中已经提供了这个算法的实现了，可是其实现的细节我以为写的真恶心（我以为Opencv全部的算法写的都恶心，饶了一堆弯才到算法的中点，感受大的工程都是这样的），其算法位于OpenCV3.0\opencv\sources\modules\photo\src\tonemap文件中，我在实现这个算法时时参考了另一个很是有名的开源软件：luminance hdr，这个软件最新的版本集成了11中用于HDR显示的算法。过完年我要再次好好的看看这个软件的代码了。app

　　话说回本文的重点，因为对论文的理解不是很深入，部份内容仅以翻译为主。dom

　　1、应用背景ide

　　简单的说，就是咱们认为显示给人眼看的亮度值L_d和场景亮度值L_w之间存在以下的关系：函数

　　其中L_max为场景的最大亮度，这个映射关系式可以保证不管真实亮度范围有多大，最亮的部分总能映射为1（白色），而其余的亮度也能平缓的变化。虽然这个算式对一些图能得到较为满意的结果，可是咱们也发现有些图的亮度压缩太过了，一些高对比度的内容也丢失了。工具

　　2、自适应对数映射测试

　　那么论文提出的色调映射方案遵循了下面几条规则：（1）无论原始数据如何分散，他必须都能输出连续的结果。（2）它应该具备自适应性和可扩展性，他必须能显示出场景的物理本质同时不得引入对比度反转和光晕。总的亮度也必须忠实于实际的内容。（3）算法也须要对用户友好，也就是说在大部分状况下须要能自动实现，少数状况须要调节一些比较直观的参数。优化

　　一、把场景亮度映射到图像亮度ui

　　输出图像的总体亮度主要是由场景的亮度特性决定的，因此找到一个从场景亮度到输出图像亮度之间的初始缩放因子很重要，这就相似于在摄影中曝光设置决定了所拍摄的图片的最终效果同样。如今的镜头都提供的不一样的自动曝光选项，好比center- weighted, center-spot以及 matrix-metering等。一样，本文提出两种不一样的方法适合于不一样的用途。对于静态图片或者当用户不直接和场景交互，咱们基于全部像素的亮度信息计算出场景的对数平均值做为初始缩放因子，对于须要交互的场合，缩放因子不是固定值，而是使用亮度的对数信息的高斯模糊后的结果，一般高斯模糊核能覆盖场景的15%范围便可以，固然也能够调整这个范围。spa

　　二、对比度调整

　　本文提出的核心的最具特点的色调映射函数就是根据每一个像素的信息来自适应的调整函数中的对数基（从2到10）。这从本质上提供了很好的对比度和细节信息，同时能对高亮度值进行很大程度上的压缩。原则上，一个更宽或者更窄的对数基也可使用，可是实际上，咱们没有任何理由去使用它。当对数基小于2时，其值迅速增长，致使曝光调整很困难。另外一方面，当对数基大于10时，亮度压缩的量很小，致使这个图片丢失了太多的对比度。同时，咱们也观察到了高对数基时的一些颜色偏移现象。

　　以下左图所示，左图时基于2对数基的，有图是基于10对数基的（全图），很明显，两幅图的对比度和亮度区别很明显，可是他们都没有给出很是使人满意的结果。

　　为了实现不一样像素不一样的对数基以及像素的连续性的要求，咱们参考了 Perlin和Hoffert的偏置对数函数，该函数是纹理分析的的标准工具而且在计算机视觉上广为应用。偏置函数定义在单位区间[0,1]之间的power函数，有一个参数b,直接决定了输出值的大小，具体形式以下：

　　其曲线如上右图所示。

　　2.3 算法细节

　　通常数据是基于RGB空间的，咱们首先将数据转换到XYZ空间，其中的Y份量反应了每一个像素的亮度值。咱们首先基于Y份量计算出对数的最大亮度L_wmax和平均亮度L_wa。而后把公式（3）带入公式(1)并作适当的阔啊站，获得最终的计算显示亮度的公式以下所示：

　　相比于论文，上述公式后半部分是我本身添加上去的，主要是为了解释方便。

　　咱们首先看下算式中的，很明显，他的取值范围是2到10之间，这和论文前面的描述是一致的。而后底部的Log₁₀也保证了整个算式的区间范围。

　　而后咱们知道，对数计算式有以下特性：　　　　

　　所以把公式（4）的后半部分展开就到了论文的结果。

　　式中有多了个参数L_dmax,这个值表示显示设备的最大显示能力，对于普通的CRT显示器，咱们直接取值为100。

　　论文后面还有关于Gamma校订的内容，那些都是辅助的了，实际上没啥意思，论文核心的就是上述公式。

　　三：具体实现即细节注意：

　　具体实现代码能够完美的参考luminance hdr，关键是要注意一些数据的范围要映射到0和1之间才能处理，特别是论文有些地方其实没有讲的特别清晰，好比在论文里有这样一句话：The XYZ luminance component Y of each pixel (Lw for world luminance) and the maximum luminance of the scene Lwmax are divided by the world adaptation luminance Lwa and eventually multiplied by an exposure factor set by the user。这里其实没有明确的说L_wa是什么（整篇论文都没有说）其实就是上面讲的对数平均值，还有最后直接用公式计算获得的L_d通常状况下是很小的，如何处理让其显示也是值得讲究的。我这里贴出对公式（4）计算的核心代码：

void ComputeScaleTable(float ScaleTable[], float Bias, float Saturation, float MaxLum, float AvLum)
{
    float Divider, BiasP, NormalY, Interpol, NewLum;
    MaxLum = MaxLum / AvLum;                    //    normalize maximum luminance by average luminance（divided by the world adaptation luminance Lwa）
    Divider = log10f(MaxLum + 1.0f);            //    论文公式（4）左半部分的除数
    BiasP = logf(Bias) / log(0.5);                //    公式（3）中的上指标    

    for (int Index = 0; Index < 256; Index++)    // Normal tone mapping of every pixel
    {
        //        The XYZ luminance component Y of each pixel (Lw for world luminance) and the maximum luminance of the scene
        //        Lwmax are divided by the world adaptation luminance Lwa and eventually multiplied by an exposure factor set by the user.
        NormalY = (Index / 255.0) / AvLum;                                            //        divided by the world adaptation luminance Lwa
        Interpol = logf(2.0f + powf(NormalY / MaxLum, BiasP) * 8.0f);                //        论文公式（4）右半部分的除数
        NewLum = (logf(NormalY + 1.0f) / Interpol) / Divider;                        //        论文公式（4）
        ScaleTable[Index] = powf(NewLum / (Index / 255.0 + 1e-4), Saturation);
    }
}

　　以上代码是针对8位图像的，上面的/255.0就是归一化到[0,1]范围的做用。可是最后一行的NewLum / (Index / 255.0 + 1e-4)大家能理解是什么意思吗?

　　最后一行代码的Saturation的做用见<Gradient domain high dynamic range compression>一文，当大于1时，图像越饱和也越亮，小于1是图像变暗。

　　虽然论文描述的算法本意是用到HDR这种高动态范围的图像的，可是实际上我目前也只实现了8位的LDR的代码，可是对于8位的图像，特别是偏暗的图像仍是有很好的加强的效果的，对于正常的图像，通常也不会出现特别很差的效果。

　　对于常态的图片，通常也能起到必定的视觉加强效果：

　　关于速度优化方面，若是是针对8位图像，则中间的不少浮点计算能够用查表代替，而XYZ和RGB空间转化，我前面一篇博客已经提到能够用SSE快速实现。处理1080P的图大概须要20ms。

　　也曾尝试不转到XYZ空间，直接提取出亮度信息，而后直接在RGB空间处理，彷佛效果也还能够，可是有可能会出现较多的偏色。

　　明年有时间把这个算法扩展到16位图像上取看看，有什么效果。

　　8位测试工程：https://files.cnblogs.com/files/Imageshop/TonemapDrago.rar