Python爬虫(2.网络爬虫的实现原理及技术)

网络爬虫的实现原理及技术 1.   网络爬虫实现原理 以两种爬虫为例,讲解网络爬虫的实现原理。 1)       通用网络爬虫 图1 通用网络爬虫实现原理及过程 见图1,通用网络爬虫的实现原理及过程可以简要概括为:          i.           获取初始URL。初始的URL地址可以由用户人为指定,也可以由用户指定的某个或某几个初始爬去网页决定。         ii.        
相关文章
相关标签/搜索