【ASCII && UNICODE】深刻理解计算机的符号化

###ASCII的来历swift

ASCII 是用来表示英文字符的一种编码规范。每一个ASCII字符占用1 个字节,所以,ASCII 编码能够表示的最大字符数是255(00H—FFH)。这对于英文而言,是没有问题的,通常只什么用到前128个(00H--7FH,最高位为0)。而最高位为1 的另128 个字符(80H—FFH)被称为“扩展ASCII”,通常用来存放英文的制表符、部分音标字符等等的一些其它符号。

可是对于中文等比较复杂的语言,255个字符显然不够用。因而,各个国家纷纷制定了本身的文字编码规范,其中中文的文字编码规范叫作“GB2312—80”, 它是和ASCII 兼容的一种编码规范, 其实就是利用扩展ASCII没有真正标准化这一点,把一个中文字符用两个扩展ASCII 字符来表示,以区分ASCII 码部分。

可是这个方法有问题,最大的问题就是中文的文字编码和扩展ASCII 码有重叠。而不少软件利用扩展ASCII 码的英文制表符来画表格,这样的软件用到中文系统中,这些表格就会被误认做中文字符,出现乱码。另外,因为各国和各地区都有本身的文字编码规则,它们互相冲突,这给各国和各地区交换信息带来了很大的麻烦。

ASCII码

###UNICODE实现国际化编码

UNICODE做为一个全新的编码系统应运而生,它能够将中文、法文、德文……等等全部的文字统一块儿来考虑,为每个文字都分配一个单独的编码。

Unicode与ASCII同样也是一种字符编码方法,它占用两个字节(0000H—FFFFH),容纳65536 个字符,这彻底能够容纳全世界全部语言文字的编码。在Unicode 里,全部的字符都按一个字符来处理, 它们都有一个惟一的Unicode 码。

在swift中命令行打印 print("(\u{0038})")命令行

unicode编码查询code

编码查询

相关文章
相关标签/搜索