想写这么一篇文章,可是知乎社区爬虫大神不少,光是整理他们的答案就够我这篇文章的内容了。对于我我的来讲我更喜欢那种很是实用的教程,这种教程对于想直接上手爬虫作一些小东西的朋友来讲是极好的。html
用一个精彩的回答做为开头:如何入门 Python 爬虫? - 谢科的回答python
若是你想学习编程,可是找不到学习路径和资源,欢迎关注专栏:学习编程程序员
第一:Python爬虫学习系列教程(来源于某博主:http://cuiqingcai.com/1052.html)web
Python版本:2.7
正则表达式
总体目录:mongodb
1. Python爬虫入门一之综述数据库
2. Python爬虫入门二之爬虫基础了解编程
3. Python爬虫实战三之实现山东大学无线网络掉线自动重连
6. Python爬虫实战六之抓取爱问知识人问题并保存至数据库
8. Python爬虫实战八之利用Selenium抓取淘宝匿名旺旺
2. Python爬虫利器二之Beautiful Soup的用法
3. Python爬虫利器三之Xpath语法与lxml库的用法
第二(第一的姊妹篇):Python爬虫入门教程(来源于博主:blog.csdn.net/column/details/why-bug.html)
Python版本:2.7
教程目录:
[Python]网络爬虫(一):抓取网页的含义和URL基本构成
[Python]网络爬虫(二):利用urllib2经过指定的URL抓取网页内容
[Python]网络爬虫(三):异常的处理和HTTP状态码的分类
[Python]网络爬虫(四):Opener与Handler的介绍和实例应用
[Python]网络爬虫(五):urllib2的使用细节与抓站技巧
[Python]网络爬虫(七):Python中的正则表达式教程
[Python]网络爬虫(八):糗事百科的网络爬虫(v0.3)源码及解析(简化更新)
[Python]网络爬虫(九):百度贴吧的网络爬虫(v0.4)源码及解析
[Python]网络爬虫(十):一个爬虫的诞生全过程(以山东大学绩点运算为例)
[Python]网络爬虫(11):亮剑!爬虫框架小抓抓Scrapy闪亮登场!
[Python]网络爬虫(12):爬虫框架Scrapy的第一个爬虫示例入门教程
第三:你已经看完上面(第一或者第二)的教程:再推荐知乎用户@陈惟源 的实战练习博客
Python爬虫学习记录(4)——传说中的足彩倍投法。。好像也不是那么靠谱
2011~2013.5全球全部足球比赛比分数据以及足彩各公司盘口
Python爬虫学习记录(3)——用Python获取虾米加心歌曲,并获取MP3下载地址
Python爬虫学习记录(5)——python mongodb + 爬虫 + web.py 的acfun视频排行榜
Python爬虫学习记录(0)——Python 爬虫抓站 记录(虾米,百度,豆瓣,新浪微博)第四:最后推荐知乎用户@gaga salamer 的实战练习博客
用scrapy自动下载石原sama的豆瓣影人图集(727张图片,自动下载)
但愿以上的教程能够帮助到你们。
若是你想学习编程,可是找不到学习路径和资源,欢迎关注专栏:学习编程
如何一步一步的学Java - 知乎专栏