base16，base32，base64 编码方式的通俗讲解

时间 2019-11-06

标签 base16 base base32 base64 编码方式通俗讲解栏目字符编码繁體版

原文原文链接

做者：林冠宏 / 指尖下的幽灵html

博客：http://www.cnblogs.com/linguanh/git

GitHub ： https://github.com/af913337456/程序员

腾讯云专栏： https://cloud.tencent.com/developer/user/1148436/activitiesgithub

虫洞区块链专栏：https://www.chongdongshequ.com/article/1536563643883.html算法

掘金：https://juejin.im/user/587f0dfe128fe100570ce2d8区块链

PS: 本文目的，通俗简短地介绍一次 base 类编码方式，而后让你记住。编码

首先咱们知道数据类型 char 通常占2个字节，固然还有二般的状况，好比1个字节，但这里咱们以2字节为例，例如: char r = 'a'，那么若是这种规则被修改了呢，既然可使用2个字节表示一个字符，那么为何不能够用3字节，5字节表示？当咱们其它的字节个数表示一个字符的时候，就会产生其它效果。而，上述的第一点就是相似这个意思。当表明下标的 bit 位的个数变了，下标的取值范围也跟着变，好比 2 个 bit 位最大的数是 11 = 3，而 3 个 bit 位最大的数是 111 = 7 。

对于第二点来讲，就是一个用来供查表的表格，例如9x9乘法表。这个表格是要被查询的。

编码流程

当有了上述两点的条件后，咱们将编码的流程总结为下面几点：

例如要被编码的字符串是：ILU

将 ILU 字符串中的每一个字符转为对应于 Ascii 编码表的值，I = 73, L = 76, U = 85。
将第一步中的 Ascii 值分别转为对应的二进制格式，要求必须是造成8 个 bit，不足8比特位高位补0。例如：1 的二进制是 1，明显不够8位，最终应该显示为:0000 0001。ILU 的转化结果以下：

73 = 01001001

76 = 01001100

85 = 01010101
根据base X(这里的 X 表明 16，32，64等编号) 编码算法中所指定的y 个 bit 位为一个字符在表格中的下标 的规则，对第2步的进行划分。例如 base 16的规则要求，4位做为一个下标对应一个字符，即每4个位为一部分，故划分以下：

第1部分：0100 是 (73 = 01001001，的前4个位)

第2部分：1001 是 (73 = 01001001，的后4个位)

第3部分：0100

第4部分：1100

第5部分：0101

第6部分：0101
将第三步中划分出的每一个部分进行10进制转换，得出对应于10进制数的下标值，以下：

0100 = 4，1001 = 9，4，12，5，5
最后一步，将第4步中得出的下标数去查表，得出对应的字符，连在一块儿，就是编码结果

base16 的默认编码表字符串是：数字0~9和字母A~F，共16个，将每一个的下标和值列表格，以下所示：

base16 的编码表
| 下标 | 编码值 | 下标 | 编码值 |
| ------ | ------ | ------ | ------ |
| 0 | 0 | 8 | 8 |
| 1 | 1 | 9 | 9 |
| 2 | 2 | 10 | A |
| 3 | 3 | 11 | B |
| 4 | 4 | 12 | C |
| 5 | 5 | 13 | D |
| 6 | 6 | 14 | E |
| 7 | 7 | 15 | F |

最终 ILU 的 base16 编码结果是：494C55

自定义表格

代码中，咱们能够指定本身的编码表，例以下面的一行：

var encoding = base32.NewEncoding("ybndrfg8ejkmcpqxot1uwisza345h769")

ybndrfg8ejkmcpqxot1uwisza345h769 是 32 个字符，对应 base 32 编码，下标 0 对应的字符是 y

当上面的 ILU 例子用该表格编码时，那么就再也不是: 494C55

总结

在上面的第3步，对于恰好可以整数划分的 (8 / 4 = 2 整除)，是不会有出现在最终结果后面补充等于号"="符号的状况的，而不能除尽的，将会被补充为 "=" 。下面是 16，32和64的须要bit位个数和编码表的总字符

名称	下标数字的位个数	编码表字符串	位数不足是否会补全 =
base 16	4	数字0~9 和字母 A~F	不会，位数恰好是 4 的倍数
base 32	5	大写字母A~Z 和数字2~7	会
base 64	6	大写字母A~Z，小写字母a~z，数字0~9以及"+"，"/"	会

名称	编码后，数据量变化
base 16	由一个8位表示一个字符变成 4位表示一个字符，数据量变 2 倍
base 32	变为 8/5 倍
base 64	变为 8/6=4/3 倍

补全的限制，拿base32 来讲，由于每5位表示一个字符下标值，而原始数据是8位，这就意味着，划分会出现剩下的状况，例如：
8 - 5 = 3，明显有3个 bit 位剩下，那么至少要多少个位才能知足步出现剩下的呢？这是一个最小公倍数问题，就是： 5*8 = 40 位。咱们能够验证一下，当两个字符的时候，是16位，16/5 = 1，以此类推。

最终，得出在 base32 的编码中，待编码数据至少要 >= 40 位，其最终的编码结果才能不出现 = 号。例如要被编码的字符是3，很明显，它的结果是：D=======，后面的 = 都是补全的。

同理，base64 的是至少 24 位，24 是 6 和 8 的最小公倍数。

上述，就是全部内容，记住此类编码方式的主要点：

一个字符所对应表格中的下标的 bit 位是多少个
对应的编码表格是多少

剩下的，就是照着模式走，划分、对表，得出结果。

广告时间

个人由清华大学出版社出版的区块链纯技术书籍：

《区块链以太坊DApp开发实战》
现已出版并可网购。

适合区块链初中级工程师阅读。

base16，base32，base64 编码方式的通俗讲解

目录

前言

编码流程

自定义表格

总结

上述，就是全部内容，记住此类编码方式的主要点：

广告时间

完