两种爬虫模式比较:css
一、requests和beautifulsoup都是库,scrapy是框架。web
二、scrapy框架中能够加入requests和beautifulsoup。api
三、scrapy基于twisted,性能是最大的优点。框架
四、scrapy方便扩展,提供了不少内置的功能。机器学习
五、scrapy内置的css和xpath selector很是方便,beautifulsoup最大的缺点就是慢。scrapy
爬虫能作什么?性能
一、搜索引擎---百度、谷歌、垂直搜索引擎。学习
二、推荐引擎---今日头条搜索引擎
三、机器学习数据样本rest
五、数据分析(如金融数据分析)、舆情分析等。
网页分类:
常见类型的服务:
一、静态网页
二、动态网页
三、webservice(restapi)