1.asci占用一个字节gb2312是扩展spa
2.unicode 汉字占用两个字节code
3.utf-8 汉字占三个字节utf-8
>>> name=u'中国' >>> name u'\u4e2d\u56fd' #unicode >>> print name 中国ci
>>> name.encode('utf-8') '\xe4\xb8\xad\xe5\x9b\xbd' #utf-8unicode