爬虫中文乱码繁体字乱码问题解决

工作需要爬取淘宝对应的卖家账户,为了简单就直接用正则匹配所需掌柜名称。  ps:项目较老,用的python2.7 遇到三个问题: 1.中文乱码,开始直接就 Response.encoding = 'utf-8',结果中文都是乱码。查资料可以用  Response.apparent_encoding 看出返回网页的编码格式 GB2312 2.繁体字乱码 简单中文没问题,但是繁体字又是乱码,而且Res
相关文章
相关标签/搜索