python爬虫架构

一.什么是爬虫    爬虫是一段自动抓取互联网信息的程序,用于抓取对咱们有价值的互联网信息python 二.爬虫的架构   python爬虫架构主要由五个部分组成,分别是调度器,URL管理器,网页下载器,网页解析器,应用程序(展现或应用所爬取的有价值的程序)组成架构 调度器 至关于一台电脑的cpu,负责调度URL管理器,网页下载器,网页解析器,应用程序之,以及协调他们的工做 URL管理器 网页下载
相关文章
相关标签/搜索