base16,base32,base64 编码方式的通俗讲解

做者:林冠宏 / 指尖下的幽灵html

博客:http://www.cnblogs.com/linguanh/git

GitHub : https://github.com/af913337456/程序员

腾讯云专栏: https://cloud.tencent.com/developer/user/1148436/activitiesgithub

虫洞区块链专栏:https://www.chongdongshequ.com/article/1536563643883.html算法

掘金:https://juejin.im/user/587f0dfe128fe100570ce2d8区块链


PS: 本文目的,通俗简短地介绍一次 base 类编码方式,而后让你记住。编码

目录

  • 前言
  • 编码流程
  • 自定义表格
  • 总结

前言

相信超过绝大多少的程序员都曾在各类的软件开发中使用过编码、解码,编码和解码是对应的,有编码就有解码。加密

base16,base32,base64 都是编码方式,对应有各自的一套编码算法。code

可是有人常常称它们是加密,例如 base64 加密。其实这种说法不算全对。由于默认的 base16,base32,base64 的各类信息都是公开的,公开的包含有:htm

  • 算法的运算方式
  • 编码表格,这个是主要

在 base16,base32,base64 中,一旦掌握了上面两类信息,那么就至关于破解了。甚至能够手动用笔写出编码后的结果以及根据编码结果写出解码内容。


16,32和64它们编码原理都是同样的,不一样的地方在于下面 2 东西:

  1. 一个字符所对应表格中的下标的 bit 位是多少个
  2. 对应的编码表格是多少

上述两点是什么意思呢?

首先咱们知道数据类型 char 通常占2个字节,固然还有二般的状况,好比1个字节,但这里咱们以2字节为例,例如: char r = 'a',那么若是这种规则被修改了呢,既然可使用2个字节表示一个字符,那么为何不能够用3字节,5字节表示?当咱们其它的字节个数表示一个字符的时候,就会产生其它效果。而,上述的第一点就是相似这个意思。当表明下标的 bit 位的个数变了,下标的取值范围也跟着变,好比 2 个 bit 位最大的数是 11 = 3,而 3 个 bit 位最大的数是 111 = 7 。

对于第二点来讲,就是一个用来供查表的表格,例如9x9乘法表。这个表格是要被查询的。

编码流程

当有了上述两点的条件后,咱们将编码的流程总结为下面几点:

例如要被编码的字符串是:ILU

  1. ILU 字符串中的每一个字符转为对应于 Ascii 编码表的值,I = 73, L = 76, U = 85。
  2. 将第一步中的 Ascii 值分别转为对应的二进制格式,要求必须是造成8 个 bit,不足8比特位高位补0。例如:1 的二进制是 1,明显不够8位,最终应该显示为:0000 0001ILU 的转化结果以下:

    73 = 01001001

    76 = 01001100

    85 = 01010101

  3. 根据base X(这里的 X 表明 16,32,64等编号) 编码算法中所指定的y 个 bit 位为一个字符在表格中的下标 的规则,对第2步的进行划分。例如 base 16的规则要求,4位做为一个下标对应一个字符,即每4个位为一部分,故划分以下:

    第1部分:0100 是 (73 = 01001001,的前4个位)

    第2部分:1001 是 (73 = 01001001,的后4个位)

    第3部分:0100

    第4部分:1100

    第5部分:0101

    第6部分:0101

  4. 将第三步中划分出的每一个部分进行10进制转换,得出对应于10进制数的下标值,以下:

    0100 = 4,1001 = 9,4,12,5,5

  5. 最后一步,将第4步中得出的下标数查表,得出对应的字符,连在一块儿,就是编码结果

    base16 的默认编码表字符串是:数字0~9字母A~F,共16个,将每一个的下标和值列表格,以下所示:

    base16 的编码表
    | 下标 | 编码值 | 下标 | 编码值 |
    | ------ | ------ | ------ | ------ |
    | 0 | 0 | 8 | 8 |
    | 1 | 1 | 9 | 9 |
    | 2 | 2 | 10 | A |
    | 3 | 3 | 11 | B |
    | 4 | 4 | 12 | C |
    | 5 | 5 | 13 | D |
    | 6 | 6 | 14 | E |
    | 7 | 7 | 15 | F |

    最终 ILUbase16 编码结果是:494C55

自定义表格

代码中,咱们能够指定本身的编码表,例以下面的一行:

var encoding = base32.NewEncoding("ybndrfg8ejkmcpqxot1uwisza345h769")

ybndrfg8ejkmcpqxot1uwisza345h769 是 32 个字符,对应 base 32 编码,下标 0 对应的字符是 y

当上面的 ILU 例子用 该表格编码时,那么就再也不是: 494C55

总结

在上面的第3步,对于恰好可以整数划分的 (8 / 4 = 2 整除),是不会有出现在最终结果后面补充等于号"="符号的状况的,而不能除尽的,将会被补充为 "=" 。下面是 16,32和64的须要bit位个数和编码表的总字符

名称 下标数字的位个数 编码表字符串 位数不足是否会补全 =
base 16 4 数字0~9 和 字母 A~F 不会,位数恰好是 4 的倍数
base 32 5 大写字母A~Z 和 数字2~7
base 64 6 大写字母A~Z,小写字母a~z,数字0~9以及"+","/"
名称 编码后,数据量变化
base 16 由一个8位表示一个字符 变成 4位表示一个字符,数据量变 2 倍
base 32 变为 8/5 倍
base 64 变为 8/6=4/3 倍

补全的限制,拿base32 来讲,由于每5位表示一个字符下标值,而原始数据是8位,这就意味着,划分会出现剩下的状况,例如:
8 - 5 = 3,明显有3个 bit 位剩下,那么至少要多少个位才能知足步出现剩下的呢?这是一个最小公倍数问题,就是: 5*8 = 40 位。咱们能够验证一下,当两个字符的时候,是16位,16/5 = 1,以此类推。

最终,得出在 base32 的编码中,待编码数据至少要 >= 40 位,其最终的编码结果才能不出现 = 号。例如要被编码的字符是3,很明显,它的结果是:D=======,后面的 = 都是补全的。

同理,base64 的是至少 24 位,24 是 6 和 8 的最小公倍数。

上述,就是全部内容,记住此类编码方式的主要点:

  1. 一个字符所对应表格中的下标的 bit 位是多少个
  2. 对应的编码表格是多少

剩下的,就是照着模式走,划分、对表,得出结果。

广告时间

个人由清华大学出版社出版的区块链纯技术书籍:

《区块链以太坊DApp开发实战》
现已出版并可网购。

适合区块链初中级工程师阅读。