【ASCII && UNICODE】深刻理解计算机的符号化

时间 2019-11-12

原文原文链接

###ASCII的来历swift

ASCII 是用来表示英文字符的一种编码规范。每一个ASCII字符占用1 个字节，所以，ASCII 编码能够表示的最大字符数是255（00H—FFH）。这对于英文而言，是没有问题的，通常只什么用到前128个(00H--7FH,最高位为0)。而最高位为1 的另128 个字符（80H—FFH）被称为“扩展ASCII”，通常用来存放英文的制表符、部分音标字符等等的一些其它符号。

可是对于中文等比较复杂的语言，255个字符显然不够用。因而，各个国家纷纷制定了本身的文字编码规范，其中中文的文字编码规范叫作“GB2312—80”， 它是和ASCII 兼容的一种编码规范， 其实就是利用扩展ASCII没有真正标准化这一点，把一个中文字符用两个扩展ASCII 字符来表示，以区分ASCII 码部分。

可是这个方法有问题，最大的问题就是中文的文字编码和扩展ASCII 码有重叠。而不少软件利用扩展ASCII 码的英文制表符来画表格，这样的软件用到中文系统中，这些表格就会被误认做中文字符，出现乱码。另外，因为各国和各地区都有本身的文字编码规则，它们互相冲突，这给各国和各地区交换信息带来了很大的麻烦。

###UNICODE实现国际化编码

UNICODE做为一个全新的编码系统应运而生，它能够将中文、法文、德文……等等全部的文字统一块儿来考虑，为每个文字都分配一个单独的编码。

Unicode与ASCII同样也是一种字符编码方法，它占用两个字节（0000H—FFFFH）,容纳65536 个字符，这彻底能够容纳全世界全部语言文字的编码。在Unicode 里，全部的字符都按一个字符来处理， 它们都有一个惟一的Unicode 码。

在swift中命令行打印 print("(\u{0038})")命令行

unicode编码查询code