python爬虫(一):爬虫基本流程

一、了解爬虫 网络爬虫(网页蜘蛛、网络机器人等)是通过程序去获取web页面上的目标数据(图片、视频、文本等等) 二、爬虫的本质 模拟浏览器打开网页,获取浏览器的数据(爬虫者想要的数据); 浏览器打开网页的过程:当你在通过浏览器访问一个链接后,经过DNS服务器找到服务器IP,向服务器发送一个request;服务器经过解析后,给出一个response(可以是html、js、css等文件内容),浏览器(
相关文章
相关标签/搜索