JPEG解码——(4)霍夫曼解码

时间 2021-02-22

标签编码 spa blog 图片变量二进制 d3 数据 img 栏目字符编码繁體版

原文原文链接

本篇是该系列的第四篇，主要介绍霍夫曼解码相关内容。编码

承接上篇，文件头解析完毕后，就进入了编码数据区域，即SOS的tag后的区域，也是图片数据量的大头所在。spa

1. 解码过程规则描述blog

a）今后颜色份量单元数据流的起点开始一位一位的读入，直到读入的编码与该份量直流哈夫曼树的某个码字（叶子结点）一致，而后用直流哈夫曼树图片

查得该码字对应的权值。权值（共8位）表示该直流份量数值的二进制位数，也就是接下来须要读入的位数。变量

b）继续读入位数据，直到读入的编码与该份量交流哈夫曼树的某个码字（叶子结点）一致，而后用交流哈夫曼树查得该码字对应的权值。权值的高4位二进制

表示当前数值前面有多少个连续的零，低4 位表示该交流份量数值的二进制位数，也就是接下来须要读入的位数。im

c）不断重复步骤b，直到知足交流份量数据结束的条件。d3

而结束条件有两个，只要知足其中一个便可：数据

①当读入码字的权值为零，表示日后的交流变量所有为零；
②已经读入63个交流份量。img

2. 待处理的数据区域

　　上面的规则描述过于抽象，须要一个例子来实战说明，仍使用那张animal_park.jpg的图片。

　　其二进制数据显示以下（FFDA所表明的SOS以后深色标注区域）：

　　截取到的二进制数据为：F9 96 8B FA 71 EA 5B 24 B5 ...

3. 准备好霍夫曼表

　　先列出四张霍夫曼表——DC0,AC0, DC1,AC1，待后面查找使用。

　　DC0——Y份量的直流部分

　　AC0——Y份量的交流部分（表太长，没列全）

　　DC1——UV份量的直流部分

　　AC1——UV份量的交流部分

4. 解码步骤

　　这是难点所在，解码的过程其实就是霍夫曼树的查找过程。mcu单元内部使用了RLE行程编码和霍夫曼编码来压缩数据。

　　例子：F9 96 8B FA 71 EA 5B 24 B5。。。

　　对应的二进制位展开：1111 1001, 1001 0110, 1000 1011, 1111 1010, 0111 0001, 1110 1010, 0101 1011, 0010 0100, 1011 0101。。。

step1. 先读入若干位与DC0表的Code进行匹配。

读取2位的11时，无匹配的Code，由于2位宽的Code只有0b00和0b01

3位的111 无 3 0b100，0b101和0b110。

4位的1111 无 4 0b1110。

5位的11111 无 5 0b11110。

6位的111110 有 6 0b111110，刚好匹配！其对应的CodeVal为0x7

step2. 利用上面获得的CodeVal进行拆分，并读取后面若干位。
　　0x7=0x07，高四位为0，低四位为7，则再读取后面的7位二进制，为：01, 1001 0。
　　后面读取的值，这样算：若是开头为1则为正数，若是开头为0，则为负数，而后对各位求反获得数值，便可。

　　01, 1001 0这个值，因为开头为0，则为负数，多少呢？取反获得：10, 01101 = 0x4D = 77，最后获得最终值为：-77。

step3. 经过上面两步骤的第一次扫描，获得的为Y份量的DC值，后面还需通过63次扫描获得剩余的AC值（通常扫描几回就结束了）。

　　上面DC值标记为-77。

step4. 继续经过相似step1和step2来取得AC值，注意要查找AC0表。

　　读取5位的110, 10时，有匹配的Code：0b11010=0x1a，其对应的CodeVal=0x04；
　　取得后四位的值——4，表示还需读取的二进制位数量，来表示真正的信源值——0b0010，经（step2中描述）变换后值为-13；
　　那么能够RLE标记为（0，-13），其中0来自于CodeVal的高4位，-13为另读入的数据值。可也记为key-val对。

step5. 重复step4的操做，直到获得(0，0)(位置为5B那个字节的最高四位)。

　　后面的依次为：

Code CodeVal RLE_val RLE

11, 1111 1010(0x3FA) 0x34 0111(-8) (3, -8)

00 0x1 0 (-1) (0, -1)

1, 1110 10(0x7A) 0x71 1(1) (7, 1)

00 0x1 1(1) (0, 1)

01 0x0 -- (0, 0) -> 结束于5B的高4位

step6. 经过step1-step5的扫描，获得数据：-77, (0, -13), (3, -8),(0, -1),(7, 1), (0, 1), (0, 0)

step7. step1到step6结束后，表示一个mcu的霍夫曼解码结束。

　　RLE中的(m,n)，m表示前面填充0的个数，n表示实际值。

　　其解码结果以下：