Python urllib2的使用点滴: cookie, https, put, 500/40...

时间 2019-11-05

标签 python urllib2 urllib 使用点滴 cookie https 栏目 Python 繁體版

原文原文链接

最近用urllib2写了一个公司内部用的脚本html

这个脚本要访问一个webservice，访问以前先要用https登录拿到cookie再到另外一个地方获取一个临时用的idpython

https登录，获取cookie

首先是https登录，这段很好写，之前写过校内网发帖机，轻车熟路，用cookielib的CookieJar加上HTTPCookieProcessor搞定，代码以下（其中那个超简单的lambda hack简直绝了：web

#! /usr/bin/env python
# -*- coding: utf-8 -*-
importurllib,urllib2,sys,cookielib,re,os,json
cj = cookielib.CookieJar()
 opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cj))
 url_login = 'https://xxx.yahoo.com/login/'
 body = (('username', '半瓶墨水'),
         ('password', '密码'),
         ('action', 'login'),)json
print 'login to get cookies'
 opener.open(url_login, urllib.urlencode(body))cookie

处理HTTP 403/500 Exception

可是后面用cookie去拿id的时候，就总是告诉我403错误，而后opener就抛异常，想问题想到头大，后来发现这个服务访问成功不是返回200，而是403，因此看到403的时候不要管他，直接看body内容就好了，日，不知道为何这么设计。app

怎么办呢？查了一下urllib2的文档，发现能够继承一下HTTPCookieProcessor，本身作了一个NoExceptionCookieProcesser，后来的过程当中发现webservice有时候返回400和500的时候body中包含有用的信息，一并处理了：ui

#! /usr/bin/env python
# -*- coding: utf-8 -*-
importurllib,urllib2,sys,cookielib,re,os,json
#suppress the 403/400/500 exception and return the body
classNoExceptionCookieProcesser( 
  urllib2.HTTPCookieProcessor):
defhttp_error_403( 
  self,req,fp,code,msg,hdrs):
returnfp
defhttp_error_400( 
  self,req,fp,code,msg,hdrs):
returnfp
defhttp_error_500( 
  self,req,fp,code,msg,hdrs):
returnfp

cj=cookielib.CookieJar() 
  
opener=urllib2.build_opener( 
  NoExceptionCookieProcesser( 
  cj)) 
  
url_login='https://xxx.yahoo.com/login/'
body= (( 
  'username','半瓶墨水'),
         ( 
  'password','密码'),
         ( 
  'action','login'),)
print 'login to get cookies'
 opener.open(url_login, urllib.urlencode(body))url

urllib2中用PUT进行请求

而后又发现一个问题，webservice在提交的时候要求用PUT方式，而且只接受json，urllib2默认只支持GET和POST，Google了一下，发现能够建立Request对象，而后更改它的请求方法(get_method)以及header，搞定：spa

 
request = urllib2.Request(url_ws, data="blablabla")
 request.add_header('Content-Type', 'application/json')
 request.add_header('Accept', 'application/json')
 request.get_method = lambda: 'PUT'
 result = opener.open(request).read().strip()设计

参考：http://stackoverflow.com/questions/111945/is-there-any-way-to-do-http-put-in-python

1. 【Python】用原生的urllib2+httplib请求Https
2. python urllib2使用细节
3. python urllib2对http的get，put，post，delete
4. Python 标准库 urllib2 的使用细节
5. urllib2 的使用细节（转）
6. urllib,urllib2的使用
7. urllib2使用初探
8. python里urllib2库的使用
9. Python中的urllib2库的使用
10. IntelliJ IDEA使用的点点滴滴
更多相关文章...
• PHP Cookie - PHP教程
• SQLite - Python - SQLite教程
• Composer 安装与使用
• 使用Rxjava计算圆周率