Python网络爬虫(五):爬虫原理总结

爬虫的工作原理: 简单地说,就是爬虫程序模拟浏览器访问web服务器,从而获得自己感兴趣的内容的过程。 这里需要了解一下网站的工作原理。 1.基本结构 Web采用的是客户机--服务器架构。 客户端(Client)可以通过网络连接访问另一台计算机的资源或服务,而提供资源或服务的计算机就叫服务器(Server)。 比如你通过电脑上的搜狗浏览器访问一个网站www.baidu.com,在这里浏览器就是客户端
相关文章
相关标签/搜索