python爬虫编码错误 file open修改编码方式

时间 2021-01-15

原文原文链接

在使用requests.get(url).text获取到文本后，将文本写入通过open（uri,'w+'）打开的文件后，修改文件名后缀为html，打开后所有字符乱码，查阅资料后是因为编码问题，win中的txt默认为ANSI（选择另存为可查看），而从通过爬取网页读取的文本编码方式为utf-8，所以在打开文件的时候需要设置open打开文件的编码方式，具体命令为 file=open(uri,'r+',e

>>阅读原文<<

python爬虫 编码错误 file open修改编码方式

python爬虫编码错误 file open修改编码方式