编码方式ASCII、GBK、Unicode、UTF-8比较

 

文章内容深度较浅,详细了解可到下连接:https://blog.csdn.net/QuinnNorris/article/details/78705723;ui

总结了如下几种编码方式:编码

ASCII、GBK(GB23十二、GB18030)、Unicode、UTF-8spa

1.1.ASCII.net

American Standard Code for Information Interchangecode

最先的编码,一个字符一个字节。没有中文字符,用这个编译中文就会乱码。orm

一个字节8个比特,最多表示127个字符,2^7=128,7位编码。blog

后来有个扩展的,有256个字符,但不是国际标准。get

1.2.GBK、GB23十二、GB18030io

中文编码,两个字节,第一个字节最高位是1。编译

不一样国家各有标准,如,日文:Shift_JIS、韩文:Euc-kr。

1.3.Unicode

全球统一编码,包含全部国家语言的字符。
2字节,英文第一个字节是0,因此大量英文字会浪费空间。

1.4.UTF-8

变长编码,灵活“容错率”强,可为1字节可为2字节,1-4字节。

英文上,UTF-8与ASCII同样。

中文用了三个字节。

单字节0开头,双字节110..10..开头,三字节1110..10..10..开头。

相关文章
相关标签/搜索