python知识点(爬虫)

网络爬虫:
网站python

  按渲染方式浏览器

        服务端渲染网络

              基础库app

                  urllib---原生底层库curl

                  urllib3---相比urllib增长特性异步

                  httplib2---基础请求库网站

                  pycurl---libcurl的python实现url

                  hyper---支持HTTP2新特性ip

              封装库同步

                  requests---基于urllib3简单易用

                  grab---基于urllib3及PyQuery封装

                  MechanicalSoup---基于requests和BeautifulSoup封装

        客户端渲染

              寻找Ajax请求

              模拟浏览器

              模拟JavaScript

  按同步异步app

相关文章
相关标签/搜索