网络爬虫:
网站python
按渲染方式浏览器
服务端渲染网络
基础库app
urllib---原生底层库curl
urllib3---相比urllib增长特性异步
httplib2---基础请求库网站
pycurl---libcurl的python实现url
hyper---支持HTTP2新特性ip
封装库同步
requests---基于urllib3简单易用
grab---基于urllib3及PyQuery封装
MechanicalSoup---基于requests和BeautifulSoup封装
客户端渲染
寻找Ajax请求
模拟浏览器
模拟JavaScript
按同步异步app