Python的编码格式对于初学者来讲是很头疼的一件事,不过若是接触的多了,就会发现,只要在恰当的时候使用了刚好的编码,就不会出现太多的问题。python
python 的编码格式2.x 和3.x是不同的python3.x
2.x采用的默认编码格式是:ascii编码
3.x采用的默认编码格式是:utf-8spa
咱们在新建一个python文件的时候,咱们会在第一行声明文件采用的编码格式,咱们会添加utf-8的编码格式:code
# -*- coding: UTF-8 -*-
或者
# coding:utf-8对象
上述两种方式是等价的。blog
在Python2.x中,处理中文转码时候,咱们须要将默认编码格式设置成utf-8,python3.x是不须要设置的,由于系统默认编码格式已是utf-8了utf-8
import sys reload(sys) sys.setdefaultencoding('utf-8')
Python中的转码使用encode()和decode()两个方法:ci
若是要将一个utf-8或者是gbk的字符串解码成unicode对象,咱们须要使用decode():unicode
str = '人生苦短,我用python' 这是一个utf-8格式的中文字符串
unicode_str = str.decode('utf-8') 这样就解码成了一个unicode的字符串
gbk_str = unicode_str.encode('gbk') 这样,将unicode编码的字符串转化成gbk格式