python-45: opener 的使用

上一小节讲了cookielib 的使用,不知道你们仔细看了没有,为了便于分析,我这里引用上一节的一段代码php

import urllib2
import cookielib
#声明一个CookieJar对象实例来保存cookie
cookie = cookielib.CookieJar()
#利用urllib2库的HTTPCookieProcessor对象来建立cookie处理器
handler=urllib2.HTTPCookieProcessor(cookie)
#经过handler来构建opener
opener = urllib2.build_opener(handler)
#此处的open方法同urllib2的urlopen方法,也能够传入request
response = opener.open('http://www.baidu.com')
for item in cookie:
    print 'Name = '+item.name
    print 'Value = '+item.value

其实上一节的三段代码很好理解,只要你认真的去看而后找出他们的规律,这里我给你们简单的说一下python

  1. 前两句是引入模块的操做,只要记住须要什么模块就行
    cookie

  2. cookie = cookielib.CookieJar() 前面说了CookieJar用来保存cookies到变量中函数

  3. handler=urllib2.HTTPCookieProcessor(cookie)
    opener = urllib2.build_opener(handler)
    response = opener.open('http://www.baidu.com')测试

        这三句话每段程序里面都有ui

    4. 剩下来的就是对数据的各类操做,包括输出,保存,载入等等url

一、二、4 都很容易,因此咱们只要重点分析 3 就好,其实 3 也就是这一小节的重点, opener的使用.net

咱们先来看带有网址的 response = opener.open('http://www.baidu.com'),是否是跟咱们前面的某段代码很像呢,如今我把这段代码贴出来看看
response = urllib2.urlopen('http://www.baidu.com')
咱们知道urllib2.urlopen的做用是打开一个网址,那么相似的,opener.open是否是也能够打开一个网址呢?咱们能够编写代码来测试看看,可是在编写以前我又认真的看了这三句话,第一句我不知道是什么意思,暂且无论,第二句我原本也不知道的,可是我看到 build_opener 这个单词,build不就是构建,建造的意思吗?并且 opener也是执行这一句以后得来的,这是否是说,要完成整个的功能,我至少须要用到这两句话,因而我测试了下面的代码:
code

#!/uer/bin/env python
# -*- coding: UTF-8 -*-
__author__ = '217小月月坑'
'''
测试opener.open功能
'''

import urllib2

opener = urllib2.build_opener()
response = opener.open("http://www.lvye.org/userinfo.php?uid=409557")
print response.read()

OK,有输出,这说明了opener.open就是打开一个网址的操做,可是urlopen和opener.open 有什么区别呢?
1. urlopen是opener.open中的一种,是最简单的opener.open
2. 基本的urlopen()函数不支持验证、cookie或其余HTTP高级功能,要支持这些功能,必须使用opener
3. build_opener()函数来建立本身的自定义Opener对象
对象

关于build_opener()函数的更多信息,能够看下面这张图片(本图出自现代魔法学院:http://www.nowamagic.net/academy/detail/1302879

结合咱们最近讲的内容,咱们来看看要建立一个能够处理cookies的opener应该怎么作呢
从图上咱们能够看出,要给opener增长处理cookies的功能,咱们须要使用到 HTTPCookieProcessor 的处理程序,咱们试着来写一下

opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cookie))
response = opener.open('http://www.baidu.com')

咱们再给程序变变形:

handler=urllib2.HTTPCookieProcessor(cookie)
opener = urllib2.build_opener(handler)
response = opener.open('http://www.baidu.com')

这不就是前面说的3句话吗

有了这三句话的理解,咱们再加上前面说的cookielib模块里面相应的类的功能,前面使用cookielib的例子就很好记下来了

相关文章
相关标签/搜索