python以gzip header请求html数据时,response内容乱码没法解码的解决方案

1. 问题背景 在使用urllib2 module抓取web数据时,若是但愿使用如何request header,减小传输时数据量。返回的数据,是通过gzip压缩的。直接按照 content.decode(“utf8”), 解码会出现异常,而且也没法检测网页数据的实际编码类型。html 2. 问题分析 由于http请求中,若是在request header包含”Accept-Encoding”:”
相关文章
相关标签/搜索