关于ASCII和GB23十二、GBK、GB18030、UNICODE

关于ASCII和GB23十二、GBK、GB18030、UNICODE,这篇文章的讲解颇有趣,读者比较容易理解。ASCII-->GB2312-->GBK-->GB18030-->UNICODE的发展历程
这里,我就大概总结下:程序员

ASCII编码函数

ASCII编码起源于美国,用一个字节来表示一个字符,所以能够表示256个字符。起初,美国人只使用了1-127个字符,但很快,其余国家开始用尽了剩下的字符(128-255,称为扩展字符集)。编码


GB2312编码.net

后来,中国也引进了计算机,发现经常使用的汉字有6000多个,可是在ANCII编码方案中的全部字符已经被使用殆尽。此时,GB2312编码应运而生。
GB2312编码方案规定:2个字符表示一个汉字。一个小于127的字符的意义与原来相同,但两个大于127的字符连在一块儿时,就表示一个汉字。这样就能够组合出大约7000多个简体汉字。code


GBK编码blog

后来,中国程序员发现,使用GB2312编码方案仍是没法表示某些字,因而干脆再也不要求低字节必定是127号以后的内码,只要第一个字节是大于127就固定表示这是一个汉字的开始,无论后面跟的是否是扩展字符集里的内容。这既是GBK编码,GBK 包括了 GB2312 的全部内容,同时又增长了近20000个新的汉字(包括繁体字)和符号。
这种方案,1个汉字==2个字符开发


UNICODE编码get

在UNICODE编码出现以前,各个国家都有本身的一套编码方案,所以搞得谁也不认识谁,谁也不支持别人的编码。
此时,为了国际统一,ISO(国际标谁化组织),从新搞一个包括了地球上全部文化、全部字母和符号的编码!这就是Unicode编码。Unicode是用两个字节来表示为一个字符,总共能够组合出65535不一样的字符效率


ASCII时代:一个汉字==2个字符
UNICODE时代:一个汉字==1个字符扩展

为何使用Unicode

当开发应用程序时,固然应该考虑利用Unicode的优势。即便如今你不打算对应用程序进 行本地化,开发时将Unicode放在心上,确定能够简化未来的代码转换工做。此外,Unicode还 具有下列功能: • 能够很容易地在不一样语言之间进行数据交换。 • 使你可以分配支持全部语言的单个二进制. exe文件或DLL文件。 • 提升应用程序的运行效率(本章后面还要详细介绍)。 Win2000之后的系统从底层支持Unicode字符。就如今来看,尽可能要要用Unicode字符,这样能够提升程序效率,避免系统在内部进行转换。Win2000之后的系统中,全部API函数只接受Unicode字符,若是传入ASCII字符,系统会自动把它转换成Unicode字符,再调用函数。

相关文章
相关标签/搜索