初识python爬虫

1,爬虫的定义: 模拟客户端发送请求,并获取响应,理论上来说,客户端能做的事情,一般爬虫都能做。 2,爬虫的分类: 分为通用爬虫和聚焦爬虫 通用爬虫: 搜索引擎的爬虫,一般爬取多个网站,例如百度,新浪新闻等 聚焦爬虫 :针对某个特定的网站,爬取需要的数据 3,爬虫的工作流程: 4,第一个爬虫(爬取百度首页源代码) 解释:首先必须对python基础有一定的了解,并安装pycharm等编辑器,并且我们
相关文章
相关标签/搜索