`html
属性 | 说明 |
---|---|
r.status_code | HTTP请求返回的状态,200表示成功,404表示失败,还有其余的也表明失败 |
r.text | HTTP响应内容转换成字符串格式 |
r.content | HTTP响应内容转换成二进制格式 |
r.encoding | 从HTTP header中猜想响应内容 |
r.apparent_encoding | 从内容中分析响应内容的编码方式(备选编码方式) |
r.encoding
与r.apparent_encoding
python
r.encoding:若是header中不存在charset,则默认编码为ISO-8859-1json
apparent_encoding比encoding更加准确的展现编码方式浏览器
异常 | 说明 |
---|---|
requests.ConnectionError | 网络链接错误异常,如DNS查询失败、拒绝链接等 |
requests.HTTPErro | HTTP错误异常 |
requests.URLRequired | URL缺失异常 |
requests.TooManyRedirects | 超过最大重定向次数,产生重定向异常 |
requests.ConnectTimeout | 链接远程服务器超时异常 |
requests.Timeout | 请求URL超时,产生超时异常 |
若是在r.status_code不是200时候,咱们能够r.raise_for_status(),若是不是200,引起HTTPError异常服务器
举例:通用爬取的框架cookie
import requests def get_html_text(url): try: r =requests.get(url,timeout=30) r.raise_for_status() #若是不是200,引起HTTPError异常 r.encoding = r.apparent_encoding return r.text except: return '产生异常' if __name__ == '__main__' #在pycharm中你能够直接main+Tab快速出这行 get_html_text(https://www.cnblogs.com/pythonywy)
http协议中6个方法 | 介绍 |
---|---|
GET | 请求获取url位置的资源 |
HEAD | 请求获取url位置的资源的响应报告,及得到头部信息 |
POST | 请求获取url位置的资源后附加用户新的数据 |
PUT | 请求获取url位置储存一个资源,覆盖原url位置资源 |
PATCH | 请求局部更新url位置资源,及改变该处资源的部份内容 |
DELETE | 请求删除url位置储存的资源 |
获取云端资源用get,head网络
把本身资源放入云端用put post patchapp
删除现有资源del框架
用url对资源位置的定义post
1.patch与put区别
patch能够对于局部修好,put是所有覆盖
requests与协议方法一一对应
方法 | 介绍 |
---|---|
requests.request() | 设置请求格式 |
requests.get() | 请求获取url位置的资源 |
requests.head() | 请求获取url位置的资源的响应报告,及得到头部信息 |
requests.post() | 请求获取url位置的资源后附加用户新的数据 |
requests.put() | 请求获取url位置储存一个资源,覆盖原url位置资源 |
requests.patch() | 请求局部更新url位置资源,及改变该处资源的部份内容 |
requests.delete() | 请求删除url位置储存的资源 |
params
:字典或字节序列,做为参数增长到连接中data
:字典,字节序列或文件对象,做为请求的内容json
:JSON格式的数据,做为Request的内容headers
:字典,HTTP定制头(模拟浏览器进行访问)cookies
:字典或CpplieJar,Request中的cookieauth
:元祖,支持HTTP认证功能files
:字典类型,传输文件timeout
:设定超时时间,秒为单位proxies
:字典类型,设定访问代理服务器,能够增长登录认证allow_redirects
:True//False,默认为True,重定向开关stream
:True/False,默认为True,获取内容当即下载开关verify
:True/False,默认为True,认证SSL证书开关cert
:本地SSL证书路径