爬虫攻略（一）

时间 2021-07-14

原文原文链接

互联网 Web 就是一个巨大无比的数据库，但是这个数据库没有一个像 SQL 语言可以直接获取里面的数据，因为更多时候 Web 是供肉眼阅读和操作的。如果要让机器在 Web 取得数据，那往往就是我们所说的“爬虫”了。现在项目需要，所以研究研究，把大概的过程和“坑”记录下来，也欢迎大渣批评和补充。爬虫的思路十分简单：按照一定的规律发送 HTTP 请求获得页面 HTML 源码（必要时需要加上一定的

>>阅读原文<<