在HTTP协议中,post提交的数据必须放在消息主体中,可是协议中并无规定必须使用什么编码方式,从而致使了 提交方式 的不一样。服务端根据请求头中的 Content-Type 字段来获知请求中的消息主体是用何种方式进行编码,再对消息主体进行解析。javascript
具体的编码方式包括以下:java
- application/x-www-form-urlencoded # 以form表单形式提交数据,最多见也是你们最熟悉的 - application/json # 以json串提交数据。 - multipart/form-data # 上传文件
下面使用requests来发送上述三种编码的POST请求。python
requests提交Form表单,通常存在于网站的登陆,用来提交用户名和密码。以 http://httpbin.org/post 为例,在requests中,以form表单形式发送post请求,只须要将请求的参数构形成一个字典,而后传给requests.post()的data参数便可。ajax
代码以下:json
url = 'http://httpbin.org/post' d = {'key1': 'value1', 'key2': 'value2'} r = requests.post(url, data=d) # requests.post() 中利用 data 属性 print r.text
输出效果以下:api
{ "args":{}, "data":"", "files":{}, "form":{"key1":"value1","key2":"value2"}, "headers":{"Accept":"*/*","Accept-Encoding":"gzip, deflate", "Connection":"close", "Content-Length":"23", "Content-Type":"application/x-www-form-urlencoded", "Host":"httpbin.org", "User-Agent":"python-requests/2.12.3"}, "json":null, "origin":"113.140.11.122", "url":"http://httpbin.org/post" }
httpbin.org 网站能够显示你提交请求的内容,输出的”Content-Type”:”application/x-www-form-urlencoded”,证实这是提交Form的方式。app
对于提交json串,主要是用于发送ajax请求中,动态加载数据。以拼多多网站为例,加载商品的方式为ajax,商品的内容在响应中。post
下面把请求头和请求实体列举一下:网站
import requests url = "http://jinbao.pinduoduo.com/network/api/common/goodsList" data ={"pageSize":60,"pageNumber":1,"withCoupon":0,"sortType":0} headers = { 'Content-Type':'application/json; charset=UTF-8', 'Host':'jinbao.pinduoduo.com', 'Origin':'http://jinbao.pinduoduo.com', 'Referer':'http://jinbao.pinduoduo.com/', 'User-Agent':'Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/66.0.3359.181 Mobile Safari/537.36', 'Accept': 'application/json, text/javascript, */*; q=0.01', } r = requests.post(url=url,data =data,headers=headers) print(r.text)
打印的内容以下:ui
{"success":false,"errorCode":4000000,"errorMsg":"System Error","result":null}
即便写上了 'Content-Type':'application/json; charset=UTF-8' ,返回依然出错了,缘由就在于 你的请求实体的格式错了,服务端没法解码。
正确代码是把data进行json编码,再发送。代码以下:
r = requests.post(url=url,data=json.dumps(data),headers=headers) # 利用 json 对 字典序列化
这个时候再看一下打印内容,已经正确返回商品内容了
处理将data主动编码为json发送以外,requests还提供了一个json参数,自动使用json方式发送,并且在请求头中也不用显示声明 'Content-Type':'application/json; charset=UTF-8'。
完整代码以下:
import requests url = "http://jinbao.pinduoduo.com/network/api/common/goodsList" data ={"pageSize":60,"pageNumber":1,"withCoupon":0,"sortType":0} headers = { 'Host':'jinbao.pinduoduo.com', 'Origin':'http://jinbao.pinduoduo.com', 'Referer':'http://jinbao.pinduoduo.com/', 'User-Agent':'Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/66.0.3359.181 Mobile Safari/537.36', } r = requests.post(url=url,json =data,headers=headers) # 直接把字典传给 requests.post() 的 json 参数 print(r.text)
上传文件在爬虫中使用的不多,不过仍是使用requests讲解一下使用方式。Content-Type类型为multipart/form-data,以multipart形式发送post请求,只需将一文件传给 requests.post() 的 files参数 便可。仍是以 http://httpbin.org/post 为例,代码以下:
url = 'http://httpbin.org/post' files = {'file': open('upload.txt', 'rb')} r = requests.post(url, files=files # 文件传给 requests.post() 的 files 参数 print(r.text)