数据获取——爬虫-1

时间 2019-11-08

标签数据获取爬虫栏目网络爬虫繁體版

原文原文链接

从今天开始，我将在个人博客中更新个人学习笔记和个人学习心得。我如今正在学习崔庆才老师的爬虫相关课程。相关视频下载到本地大概也有将近一年了吧，对相关内容零零散散也看了有一些，整体来讲没啥印象，更别说体系了。从上周开始，我立志一个月内将其看完，更新学习笔记。*javascript

立志不作马来人！爬虫在行动

爬虫的基本流程

主要有GET和POST两种，其他请求方法不经常使用，因此进行解释java

URL：统一资源定位器，定位网页中元素的下载位置。正则表达式

如下全部内容都可以在任意网页中按F12，在网页后端中看到，chrome中通常在“Elements"、”Source“、”Console“和“Network”选项卡中查找，FireFox浏览器“网络”、“控制台”和“查看器”选项卡中查找。*
下述四个四项内容均在“网络”选项卡中，任意点开一个请求便可找到。 *chrome

请求头

请求头中包含一些配置信息，包括浏览器信息。数据库

请求时额外提交的信息，如POST中的FormData。json

有多种相应状态：后端

服务器对浏览器的一些设置要求。浏览器

请求的资源内容安全

立志不作马来人！爬虫在行动