Python网络爬虫(七)了解爬取与反爬策略

一张图 了解 爬虫程序反爬虫 之间的关系:
在这里插入图片描述

我的Python学习专栏 中,了解了 爬虫基础 :

  1. chrome网页解析方法
  2. requests模拟访问网页
  3. re正则表达式筛选关键词
  4. bs4框架等

其中也了解了部分反爬基础:

  1. 模拟网页登录而不是Python访问网
    (网页访问是基于每个浏览器不同,有不同的request-header,如果是Python访问则没有)
  2. 其次,深入一点是cookie
    (这是加密网站给每次密码登录用户的一个辨别身份的代号,随登陆时网站刷新而刷新)
  3. base4加密算法(登录名+密码)
  4. 简单验证码处理
  5. more(学习中~)