不知道何时开始,百度网盘禁止非客户端环境下载大文件。html
因此爬取内容时,将User-Agent修改android
原本你请求头中的User-Agent是这么写的spa
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3497.100 Safari/537.36
如今修改成.net
'User-Agent': 'netdisk;8.2.0;android-android;4.4.4'
再试试说不定就能够了。code
转自或参考:爬取百度网盘资源报user is not authorized, hitcode:119
https://blog.csdn.net/wuhaibin12/article/details/85007379htm
对于小于100M的文件,在抓包获得下载链接后能够直接开始爬取内容。blog
对于大于100M的文件,爬取时会获得user is not authorized, hitcode:119的返回值。资源
不知道何时开始,百度网盘禁止非客户端环境下载大文件。it
因此爬取内容时,将User-Agent修改class
原本你请求头中的User-Agent是这么写的
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3497.100 Safari/537.36
如今修改成
'User-Agent': 'netdisk;8.2.0;android-android;4.4.4'
再试试说不定就能够了。