asci、unicode、utf-8

1.asci占用一个字节gb2312是扩展spa

2.unicode 汉字占用两个字节code

3.utf-8 汉字占三个字节utf-8

>>> name=u'中国'
>>> name
u'\u4e2d\u56fd'         #unicode
>>> print name
中国
ci

>>> name.encode('utf-8')
'\xe4\xb8\xad\xe5\x9b\xbd'    #utf-8
unicode

相关文章
相关标签/搜索