其实到这里我也不知道应该怎么讲,由于一开始我并不知道这个最简单的爬虫程序怎么写,单靠我本身想是写不出来的,因此就上网找了个程序,我要先让程序运行起来而后再慢慢的一行一行代码的去解析,我以为这个相对来讲是一个比较好的方法
因此这里先抛给你们这个程序,先试着让程序跑起来
1. 最简单的python爬虫源程序
这是一个最简单的python爬虫,它的功能是将网页的源代码获取并显示出来,代码很简单加上注释才有8行html
#!/usr/bin/env python # -*- coding: UTF-8 -*- __author__ = '217小月月坑' import urllib2 response = urllib2.urlopen("http://python.jobbole.com/81339/") print response.read()