【第一章】爬虫的介绍

1.爬虫的实际例子: 搜索引擎(百度、谷歌等) 伯乐在线 慧慧购物助手 2.什么是爬虫:爬虫是一个模拟人类请求网站的行为的程序,自动请求网页,获取数据,清洗数据,保存数据库。 3.通用爬虫和聚焦爬虫 通用爬虫:就是讲互联网上的网页下载到本地,形成一个互联网内容的镜像备份。 聚焦爬虫:是一种面向需求的网络爬虫,会对需求进行筛选,不是全部内容下载下来。 4.准备工具: python 3.x pycha
相关文章
相关标签/搜索