四.字符编码

有引号引发来的是字符串 没有字符串的是变量python

字符编码python3.x

支持中文的第一张表就叫 GB2312编码

1980年 gb2312 6700+汉字 1995年 gbk1.0 20000汉字 2000年 gb18030 27000汉字

最后联合国弄了个Unicode 万国码 适用于全部国家和地区的编码

2**16=65535 存一个字节,统一占用两个字符code

UTF-8=unicode 的扩展集,可变长的字符编码集 西欧国家两个字节,东亚地区三个字节utf-8

assic-->gb2312-->gbk1.0-->gb18030unicode

assic-->unicode-->utf-8/utf-16字符串

python2.x默认编码ASSIC python3.x默认编码Unicode字符编码

unicode是向下兼容根本2312,gbk变量

#!-*- coding:utf-8 -*-或者写#coding:utf-8 在Python2.x 下写中文时扩展

msg= u"我爱北京天安门?"

相关文章
相关标签/搜索