爬取百度网盘资源报user is not authorized, hitcode:119

爬取百度网盘资源报user is not authorized, hitcode:119

1、总结

一句话总结:

多是百度网盘禁止非客户端环境下载大文件,因此将请求头改成客户端:'User-Agent': 'netdisk;8.2.0;android-android;4.4.4'

不知道何时开始,百度网盘禁止非客户端环境下载大文件。html

因此爬取内容时,将User-Agent修改android

原本你请求头中的User-Agent是这么写的spa

'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3497.100 Safari/537.36

如今修改成.net

'User-Agent': 'netdisk;8.2.0;android-android;4.4.4'

再试试说不定就能够了。code

 

 

 

2、爬取百度网盘资源报user is not authorized, hitcode:119

转自或参考:爬取百度网盘资源报user is not authorized, hitcode:119
https://blog.csdn.net/wuhaibin12/article/details/85007379htm

 

对于小于100M的文件,在抓包获得下载链接后能够直接开始爬取内容。blog

对于大于100M的文件,爬取时会获得user is not authorized, hitcode:119的返回值。资源

不知道何时开始,百度网盘禁止非客户端环境下载大文件。it

因此爬取内容时,将User-Agent修改class

原本你请求头中的User-Agent是这么写的

'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3497.100 Safari/537.36

如今修改成

'User-Agent': 'netdisk;8.2.0;android-android;4.4.4'

再试试说不定就能够了。

相关文章
相关标签/搜索