编码的种类

时间 2019-11-26

标签编码种类栏目字符编码繁體版

原文原文链接

日本游戏进口到中国----》中国的电影没有日本的编码集----》致使乱码windows

要想不乱----》装语言包----》可以正常显示日文编码

联合国万国码 -----》支持全球全部的语言spa

1. unicode , 2-4个字节，已经收录136690个字符（中文就有2万多个字符），而且一直在不断扩张中。。。。。code

2. 还能够与全球各个语言进行转换， unicode----》gbk 等等 1990年左右 orm

1. 1980年，当时不少软件都基于gb2312开发的，转向unicode 的话基本等于推到重来游戏

2. Unicode = 英语，gbk = 汉语，没有强烈的需求全都转为Unicode内存

全球计算机厂商出厂的都支持Unicode，大多数软件的程序都支持Unicodeutf-8

中国的windows 电脑上都是gbk编码的unicode

Unicode 又带来一个新问题，在内存里空间大没问题，若是要传输或者存在硬盘上，空间大了一倍浪费+效率低开发

针对unicode的传输+存储，作了一个utf-8（全称：Unicode Transformation Format ，学术名UTF ），总共有三个版本，utf - 8 ，utf - 16 ，utf - 32

UTF - 8 ：使用一、二、三、4个字节表示全部字符；优先使用1个字符，无法知足则使增长1个字节，最多4个字节，英文占1个字节，欧洲语系占2个，东亚占3个，其余及特殊字符占4个字节

py 2 = ACSII

py 3 = Unicode

编写程序前须要先声明用什么方式编码