网络爬虫入门

一: Urllib的基础使用 Urllib模块 urllib它是Python的内置的Htpp请求库,有四个模块 1.request : 它是最基本的HTTP请求模块,可以用来模拟发送请求 2.error: 异常处理模块。 3.parse:一个工具模块,提供了许多URL处理方法 4.robotparser: 主要是用来识别网站的robots.txt文件,然后来判断哪些网站可以爬…等 发送请求 url
相关文章
相关标签/搜索