编码的种类

日本游戏进口到中国----》中国的电影没有 日本的编码集----》致使乱码windows

要想不乱----》装语言包----》可以正常显示日文   编码

联合国       万国码   -----》支持全球全部的语言spa

1. unicode ,   2-4个字节,已经收录136690个字符(中文就有2万多个字符),而且一直在不断扩张中。。。。。code

2. 还能够与全球各个 语言进行转换, unicode----》gbk 等等                1990年左右    orm

   1. 1980年,当时不少软件都基于gb2312开发的,转向unicode 的话基本等于推到重来游戏

   2. Unicode = 英语,gbk = 汉语,没有强烈的需求全都转为Unicode内存

   全球计算机厂商出厂的都支持Unicode,大多数软件的程序都支持Unicodeutf-8

中国的windows 电脑上都是gbk编码的unicode

Unicode 又带来一个新问题, 在内存里空间大没问题 ,若是要传输或者存在硬盘上,空间大了一倍浪费+效率低开发

针对unicode的传输+存储,作了一个utf-8(全称:Unicode Transformation Format ,学术名UTF ),总共有三个版本,utf - 8 ,utf - 16 ,utf - 32

UTF - 8 :使用一、二、三、4个字节表示全部字符;优先使用1个字符,无法知足则使增长1个字节,最多4个字节,英文占1个字节,欧洲语系占2个,东亚占3个,其余及特殊字符占4个字节

 

字符 ACSII Unicode UTF -8
A 01000001 00000000 01000001 01000001
x 01001110 00101101    11100100 10111000 10101101

                                                                                                               

py 2 = ACSII

py 3 = Unicode

编写程序前须要先声明用什么方式编码

相关文章
相关标签/搜索