Http请求首部Accept-Language

今天下午写爬虫,目标网站是个西班牙站点,开始的时候没当回事,结果在爬一个PDF文件的时候,遇到了问题:Chrome中的PDF与程序获得的PDF内容不一致,见下图:缓存



因为本人不认识西班牙语,开始的时候一直觉得因为程序获得的文件的字节流有问题而致使解码错误,猜想了不少方面,包括GZIP压缩、响应格式、文件缓存等,尝试了一下午,仍是没有解决。吃过晚饭后,注意到Chrome中的请求首部:Accept-Language,这时才察觉到多是目标网站进行了国际化。在程序中添加这个首部,果真恢复了正常。网站

相关文章
相关标签/搜索