Python urllib2的使用点滴: cookie, https, put, 500/40...

最近用urllib2写了一个公司内部用的脚本html

这个脚本要访问一个webservice,访问以前先要用https登录拿到cookie再到另外一个地方获取一个临时用的idpython

https登录,获取cookie

首先是https登录,这段很好写,之前写过校内网发帖机,轻车熟路,用cookielib的CookieJar加上HTTPCookieProcessor搞定,代码以下(其中那个超简单的lambda hack简直绝了:web

#! /usr/bin/env python
# -*- coding: utf-8 -*-
import  urllib ,  urllib2 ,  sys ,  cookielib ,  re ,  os ,  json

cj = cookielib.CookieJar()
opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cj))
url_login = 'https://xxx.yahoo.com/login/'
body = (('username', '半瓶墨水'),
        ('password', '密码'),
        ('action', 'login'),)json

print 'login to get cookies'
opener.open(url_login, urllib.urlencode(body))cookie

处理HTTP 403/500 Exception

可是后面用cookie去拿id的时候,就总是告诉我403错误,而后opener就抛异常,想问题想到头大,后来发现这个服务访问成功不是返回200,而是403,因此看到403的时候不要管他,直接看body内容就好了,日,不知道为何这么设计。app

怎么办呢?查了一下urllib2的文档,发现能够继承一下HTTPCookieProcessor,本身作了一个NoExceptionCookieProcesser,后来的过程当中发现webservice有时候返回400和500的时候body中包含有用的信息,一并处理了:ui

#! /usr/bin/env python
# -*- coding: utf-8 -*-
import  urllib ,  urllib2 ,  sys ,  cookielib ,  re ,  os ,  json
#suppress the 403/400/500 exception and return the body
class  NoExceptionCookieProcesser( urllib2 . HTTPCookieProcessor ):
   def  http_error_403( self ,  req ,  fp ,  code ,  msg ,  hdrs ): 
     return  fp
   def  http_error_400( self ,  req ,  fp ,  code ,  msg ,  hdrs ): 
     return  fp
   def  http_error_500( self ,  req ,  fp ,  code ,  msg ,  hdrs ): 
     return  fp
  
cj  =  cookielib . CookieJar()
opener  =  urllib2 . build_opener( NoExceptionCookieProcesser( cj))
url_login  =  'https://xxx.yahoo.com/login/'
body  = (( 'username' ,  '半瓶墨水' ),
        ( 'password' ,  '密码' ),
        ( 'action' ,  'login' ),)

print 'login to get cookies'
opener.open(url_login, urllib.urlencode(body))url

urllib2中用PUT进行请求

而后又发现一个问题,webservice在提交的时候要求用PUT方式,而且只接受json,urllib2默认只支持GET和POST,Google了一下,发现能够建立Request对象,而后更改它的请求方法(get_method)以及header,搞定:spa

request = urllib2.Request(url_ws, data="blablabla")
request.add_header('Content-Type', 'application/json')
request.add_header('Accept', 'application/json')
request.get_method = lambda: 'PUT'
result = opener.open(request).read().strip()设计

参考:http://stackoverflow.com/questions/111945/is-there-any-way-to-do-http-put-in-python

相关文章
相关标签/搜索