ASCII码和 Base64编码

时间 2019-11-17

标签 ascii base64 base 编码栏目字符编码繁體版

原文原文链接

ASCII编码

ASCII码(American Standard Code for Information Interchange, 美国信息互换标准代码) 是基于拉丁字母的一套电脑编码系统, 是现今最通用的单字节编码系统.java

ASCII码能够用来表示大小写英文字母以及部分字符和控制符, 可是中文俄语法语字符均不能表示, 因此后续出现了能够表示全球字符的utf-8用来解决此问题.编码

咱们知道在java中, 一个char能够认为是一个int值, 举例: code

这里的对应关系就是基于ASCII编码, 其中 A-Z, a-z, 0-9的对应关系以下:

现有的字符集很是多, 经常使用的有 UTF-8 / GBK 等, 这里面的某些字节在某些传输渠道中不支持, 好比邮件传输就不支持上面ASCII码中的控制字符, Base64的建立就是为了解决此问题.orm

Base64内的64是指64个字符, 分别是 A-Z, a-z, 0-9, +, / 它们与十进制的对应关系以下:cdn

Base64有64个字符, 2^6 = 64, 因此每一个Base64编码字符能够用一个6位的二进制来表示. 这样的话若是有3个字节的二进制, 能够用4位Base64字符表示.blog

编码流程以下:utf-8

举例字符串

那若是待编码字符串的长度不是3的倍数呢? 这样的话就ASCII转化的二进制数串不能整除于6了, 也就不能编码为Base64. 这样的状况为了能够整除6编译出完整的字节数, 就须要用0补位. 若是有连续6位都是0的话, 就用=来表示.it

举例io

相信看完这两个例子, 咱们就对Base64的编码过程有一个比较清晰的认识了.