本篇是该系列的第四篇,主要介绍霍夫曼解码相关内容。编码
承接上篇,文件头解析完毕后,就进入了编码数据区域,即SOS的tag后的区域,也是图片数据量的大头所在。spa
1. 解码过程规则描述blog
a)今后颜色份量单元数据流的起点开始一位一位的读入,直到读入的编码与该份量直流哈夫曼树的某个码字(叶子结点)一致,而后用直流哈夫曼树图片
查得该码字对应的权值。权值(共8位)表示该直流份量数值的二进制位数,也就是接下来须要读入的位数。变量
b)继续读入位数据,直到读入的编码与该份量交流哈夫曼树的某个码字(叶子结点)一致,而后用交流哈夫曼树查得该码字对应的权值。权值的高4位二进制
表示当前数值前面有多少个连续的零,低4 位表示该交流份量数值的二进制位数,也就是接下来须要读入的位数。im
c)不断重复步骤b,直到知足交流份量数据结束的条件。d3
而结束条件有两个,只要知足其中一个便可:数据
①当读入码字的权值为零,表示日后的交流变量所有为零;
②已经读入63个交流份量。img
2. 待处理的数据区域
上面的规则描述过于抽象,须要一个例子来实战说明,仍使用那张animal_park.jpg的图片。
其二进制数据显示以下(FFDA所表明的SOS以后深色标注区域):
截取到的二进制数据为:F9 96 8B FA 71 EA 5B 24 B5 ...
3. 准备好霍夫曼表
先列出四张霍夫曼表——DC0,AC0, DC1,AC1,待后面查找使用。
DC0——Y份量的直流部分
AC0——Y份量的交流部分(表太长,没列全)
DC1——UV份量的直流部分
AC1——UV份量的交流部分
4. 解码步骤
这是难点所在,解码的过程其实就是霍夫曼树的查找过程。mcu单元内部使用了RLE行程编码和霍夫曼编码来压缩数据。
例子:F9 96 8B FA 71 EA 5B 24 B5。。。
对应的二进制位展开:1111 1001, 1001 0110, 1000 1011, 1111 1010, 0111 0001, 1110 1010, 0101 1011, 0010 0100, 1011 0101。。。
step1. 先读入若干位与DC0表的Code进行匹配。
读取2位的11时, 无匹配的Code,由于2位宽的Code只有0b00和0b01
3位的111 无 3 0b100,0b101和0b110。
4位的1111 无 4 0b1110。
5位的11111 无 5 0b11110。
6位的111110 有 6 0b111110,刚好匹配!其对应的CodeVal为0x7
step2. 利用上面获得的CodeVal进行拆分,并读取后面若干位。
0x7=0x07,高四位为0,低四位为7,则再读取后面的7位二进制,为:01, 1001 0。
后面读取的值,这样算:若是开头为1则为正数,若是开头为0,则为负数,而后对各位求反获得数值,便可。
01, 1001 0这个值,因为开头为0,则为负数,多少呢?取反获得:10, 01101 = 0x4D = 77,最后获得最终值为:-77。
step3. 经过上面两步骤的第一次扫描,获得的为Y份量的DC值,后面还需通过63次扫描获得剩余的AC值(通常扫描几回就结束了)。
上面DC值标记为-77。
step4. 继续经过相似step1和step2来取得AC值,注意要查找AC0表。
读取5位的110, 10时,有匹配的Code:0b11010=0x1a,其对应的CodeVal=0x04;
取得后四位的值——4,表示还需读取的二进制位数量,来表示真正的信源值——0b0010,经(step2中描述)变换后值为-13;
那么能够RLE标记为(0,-13),其中0来自于CodeVal的高4位,-13为另读入的数据值。可也记为key-val对。
step5. 重复step4的操做,直到获得(0,0)(位置为5B那个字节的最高四位)。
后面的依次为:
Code CodeVal RLE_val RLE
11, 1111 1010(0x3FA) 0x34 0111(-8) (3, -8)
00 0x1 0 (-1) (0, -1)
1, 1110 10(0x7A) 0x71 1(1) (7, 1)
00 0x1 1(1) (0, 1)
01 0x0 -- (0, 0) -> 结束于5B的高4位
step6. 经过step1-step5的扫描,获得数据:-77, (0, -13), (3, -8),(0, -1),(7, 1), (0, 1), (0, 0)
step7. step1到step6结束后,表示一个mcu的霍夫曼解码结束。
RLE中的(m,n),m表示前面填充0的个数,n表示实际值。
其解码结果以下: