现象:最近须要抓取一些网页的信息,但发现Python的乱码问题相对Java来讲,不太同样。按照以往Java解决中文乱码问题的思路去解决Python乱码,貌似行不通,报错信息:编码
SyntaxError: Non-ASCII character '\xe5' in file.net
缘由:Python默认是以ASCII做为编码方式的,若是在本身的Python源码中包含了中文(或者其余的语言,好比小日本的日语……),此时即便你把本身编写的Python源文件以UTF-8格式保存了;但实际上,这依然是不行的。utf-8
解决方法:在源码的第一行添加如下语句:get
# -*- coding: UTF-8 -*-
或者
#coding=utf-8 源码
(注:此语句必定要添加在源代码的第一行)it