https://www.jianshu.com/p/0023bb7afddbpython
原觉得requests请求十分强大, 但遇到了模拟multipart/form-data类型的post请求, 才发现requests库仍是有一丢丢的不足。 不过也多是我理解的不足, 还但愿读者老爷不吝指教! 在此感谢!
服务器
enctype属性:
enctype:规定了form表单在发送到服务器时候编码方式,它有以下的三个值。
①application/x-www-form-urlencoded:默认的编码方式。可是在用文本的传输和MP3等大型文件的时候,使用这种编码就显得 效率低下。
②multipart/form-data:指定传输数据为二进制类型,好比图片、mp三、文件。
③text/plain:纯文体的传输。空格转换为 “+” 加号,但不对特殊字符编码。app
值得注意的是:请求头的Content-Type属性与其余post请求的不一样函数
# coding: utf-8 from collections import OrderedDict import requests # 构建有序字典 params = OrderedDict([("username", (None, '130533193203240022')), ("password", (None, 'qwerqwer')), ('captchaId', (None, 'img_captcha_7d96b3cd-f873-4c36-8986-584952e38f20')), ('captchaWord', (None, 'rdh5')), ('_csrf', (None, '200ea95d-90e9-4789-9e0b-435a6dd8b57b'))]) res = requests.get('http://www.baidu.com', files=params) print res.request.body
打印的结果:
--6c7a1966e0294e1cb89b06b95cf3da84 Content-Disposition: form-data; name="username" 130533193203240022 --6c7a1966e0294e1cb89b06b95cf3da84 Content-Disposition: form-data; name="password" qwerqwer --6c7a1966e0294e1cb89b06b95cf3da84 Content-Disposition: form-data; name="captchaId" img_captcha_7d96b3cd-f873-4c36-8986-584952e38f20 --6c7a1966e0294e1cb89b06b95cf3da84 Content-Disposition: form-data; name="captchaWord" rdh5 --6c7a1966e0294e1cb89b06b95cf3da84 Content-Disposition: form-data; name="_csrf" 200ea95d-90e9-4789-9e0b-435a6dd8b57b --6c7a1966e0294e1cb89b06b95cf3da84--
须要注意的是, 能够发现分隔符是随机生成的, 跟制定的不太同样, 这须要咱们本身手动替换
# 替换使用的re temp = re.search(r'--(.*)--', res.request.body).group(1) data = re.sub(temp, '----WebKitFormBoundaryKPjN0GYtWEjAni5F', res.request.body)
注:这种方法能够构建想要的请求体, 麻烦的是分隔符并非制定的那样,而是默认的 uuid4().hex 须要手动替换。 files能够接收的参数, 源码中解释截图在文末。
# coding: utf-8 from collections import OrderedDict from urllib3 import encode_multipart_formdata params = OrderedDict([("username", (None, '130533193203240022', 'multipart/form-data')), ("password", (None, 'qwerqwer', 'multipart/form-data')), ('captchaId', (None, 'img_captcha_7d96b3cd-f873-4c36-8986-584952e38f20', 'multipart/form-data')), ('captchaWord', (None, 'rdh5', 'multipart/form-data')), ('_csrf', (None, '200ea95d-90e9-4789-9e0b-435a6dd8b57b','multipart/form-data'))]) m = encode_multipart_formdata(params, boundary='----WebKitFormBoundaryKPjN0GYtWEjAni5F') print m[0]
# 打印结果
------WebKitFormBoundaryKPjN0GYtWEjAni5F Content-Disposition: form-data; name="username" Content-Type: multipart/form-data 130533193203240022 ------WebKitFormBoundaryKPjN0GYtWEjAni5F Content-Disposition: form-data; name="password" Content-Type: multipart/form-data qwerqwer ------WebKitFormBoundaryKPjN0GYtWEjAni5F Content-Disposition: form-data; name="captchaId" Content-Type: multipart/form-data img_captcha_7d96b3cd-f873-4c36-8986-584952e38f20 ------WebKitFormBoundaryKPjN0GYtWEjAni5F Content-Disposition: form-data; name="captchaWord" Content-Type: multipart/form-data rdh5 ------WebKitFormBoundaryKPjN0GYtWEjAni5F Content-Disposition: form-data; name="_csrf" Content-Type: multipart/form-data 200ea95d-90e9-4789-9e0b-435a6dd8b57b ------WebKitFormBoundaryKPjN0GYtWEjAni5F--
能够看获得, 这种方法多出来一个 Content-Type(我传递的参数中指定了这个值, 若是没有指定,这个Content-Type依然存在,值为:application/octet-stream), 我如今也没有太肯定多的这个值对最后的结果有没有影响。还没试...[手动捂脸]
总注:上边这两种构建参数的方式各有不一样, 用起来感受并非那么的灵活,因此感叹requests有那么一丢丢丢的不足。值的注意的是,requests.post中files参数接收字典的形式和encode_multipart_formdata中params参数接收字典形式的区别!人生苦短......
post
做者:董小贱
连接:https://www.jianshu.com/p/0023bb7afddb
来源:简书
著做权归做者全部。商业转载请联系做者得到受权,非商业转载请注明出处。网站