Python3网络爬虫(三):urllib.error异常

一.urllib.errorhtml

    urllib.error能够接收有urllib.request产生的异常。urllib.error有两个方法,URLError和HTTPError。以下图所示:python

1

2

    URLError是OSError的一个子类,HTTPError是URLError的一个子类,服务器上HTTP的响应会返回一个状态码,根据这个HTTP状态码,咱们能够知道咱们的访问是否成功。例如第二个笔记中提到的200状态码,表示请求成功,再好比常见的404错误等。服务器

1.URLErrormarkdown

    让咱们先看下URLError的异常,建立文件urllib_test06.py,编写以下代码:函数

# -*- coding: UTF-8 -*- from urllib import request from urllib import error if __name__ == "__main__": #一个不存在的链接 url = "http://www.iloveyou.com/" req = request.Request(url) try: response = request.urlopen(req) html = response.read().decode('utf-8') print(html) except error.URLError as e: print(e.reason)
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14

    咱们能够看到以下运行结果:post

3

2.HTTPErrorui

    再看下HTTPError异常,建立文件urllib_test07.py,编写以下代码:url

# -*- coding: UTF-8 -*- from urllib import request from urllib import error if __name__ == "__main__": #一个不存在的链接 url = "http://www.douyu.com/Jack_Cui.html" req = request.Request(url) try: responese = request.urlopen(req) # html = responese.read() except error.HTTPError as e: print(e.code)
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13

    运行以后,咱们能够看到404,这说明请求的资源没有在服务器上找到,www.douyu.com这个服务器是存在的,可是咱们要查找的Jack_Cui.html资源是没有的,因此抛出404异常。spa

4

二.URLError和HTTPError混合使用code

    最后值得注意的一点是,若是想用HTTPError和URLError一块儿捕获异常,那么须要将HTTPError放在URLError的前面,由于HTTPError是URLError的一个子类。若是URLError放在前面,出现HTTP异常会先响应URLError,这样HTTPError就捕获不到错误信息了。

5

    若是不用上面的方法,也能够使用hasattr函数判断URLError含有的属性,若是含有reason属性代表是URLError,若是含有code属性代表是HTTPError。建立文件urllib_test08.py,编写代码以下:

# -*- coding: UTF-8 -*- from urllib import request from urllib import error if __name__ == "__main__": #一个不存在的链接 url = "http://www.douyu.com/Jack_Cui.html" req = request.Request(url) try: responese = request.urlopen(req) except error.URLError as e: if hasattr(e, 'code') print("HTTPError") print(e.code) elif hasattr(e, 'reason') print("URLError") print(e.reason)
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17

    运行结果以下:

6

相关文章
相关标签/搜索