Python爬虫入门(二)之Requests库

Python爬虫入门(二)之Requests库

我是照着小白教程作的,因此该篇是更小白教程hhhhhhhhjavascript

1、Requests库的简介

Requests 惟一的一个非转基因的 Python HTTP 库,人类能够安全享用。(摘自Requests库官方文档java

2、Requests的功能特性

Requests 彻底知足今日 web 的需求。python

  • Keep-Alive & 链接池
  • 国际化域名和 URL
  • 带持久 Cookie 的会话
  • 浏览器式的 SSL 认证
  • 自动内容解码
  • 基本/摘要式的身份认证
  • 优雅的 key/value Cookie
  • 自动解压
  • Unicode 响应体
  • HTTP(S) 代理支持
  • 文件分块上传
  • 流下载
  • 链接超时
  • 分块请求
  • 支持 .netrc

Requests 支持 Python 2.6—2.7以及3.3—3.7,并且能在 PyPy 下完美运行。web

3、运行环境

  • Windows版本
    个人电脑用的是Win7系统,由于从上大学开始,不少软件装上使用不了,好比VC++6.0等等,当时是说Win10还有不少软件不兼容(PS:16年的Win10还不大成熟...),后来就一直用的Win7,固然前不久微软也发官方通告了,Win7被淘汰了,不过不要紧,Win7和Win10在大多数状况下,是相似的,这个爬虫系列我就以Win7为例。
  • Python版本
    看了不少教程,我下了anaconda,它是一个开源的Python发行版本,其包含了conda、Python等180多个科学包及其依赖项(PS:应该蛮好用,要否则也不会那么多人用它hhh)。此次我下的是3.8版本的,传送门Anaconda官网
  • 集成开发环境(IDE)
    我用的是PyCharm,这个比较经典还好用,是由JetBrains打造的一款Python IDE,传送门JetBrains官网

4、软件安装

  • 安装PythonPython官网操做
    进入Anaconda官网点击下载安装包
    开始安装
    开始安装界面
    注意1
    自定义安装目录,它弹了个警告,就是由于我存放的文件夹名是program Files,中间有空格,建议你们取名用连字符命名,要否则之后装Conda packages会出问题
    安装完成
    安装完成
  • 安装IDE
    JetBrains官网操做
    进入JetBrains官网点击下载安装包
    开始安装
    开始安装界面
    预设
  1. 第一个复选框是让你选择64位系统,你能够根据计算机系统肯定是否勾选
  2. 第二个复选框是将打开的文件夹作为项目添加进去
  3. 第三个复选框是关联py类型的文件,默认此类型文件用PyCharm打开
  4. 第四个复选框是将启动器dir添加到路径里

5、安装Request库

开始目录
点击开始菜单,找到Anaconda的安装目录,以管理员身份运行Anaconda Prompt浏览器

// 键入命令
conda install requests

键入命令
键入上面的命令,开始安装Request库
安装完毕
安装完毕,传送门Requests库官方文档,其中有不少本文没提到的库操做方法。
在安装此库,我遇到了一些问题,就是我看的教程里,博主是直接用的cmd,我也用管理员身份运行,我怀疑是由于安装目录和操做目录不是一个,因此键入命令,不能识别个人字。使用了Anaconda来安装该库,可能对于我来讲简单一丢丢hhhhhhh安全

6、初试PyCharm

打开PyCharm
打开PyCharm,新建项目,建议放在本身命名测试的文件夹里
新建文件
在文件夹里新建Python文件
输入下方代码导入Request库python爬虫

import requests #导入Request库

继续输入获取咱们想要的网页测试

r = requests.get('https://unsplash.com') #像目标url地址发送get请求,返回一个response对象
print(r.text) #r.text是http response的网页HTML

导入requests库
点击运行该代码
runit
页面下方获得运行结果
结果1
以上用了get请求,咱们能够继续输入下方代码查看类型
向网站发送了一个get请求,而后网站会返回一个response,r 就是response网站

print(type(r))

输入2
能够看到输出结果以下
结果2
建议你们多看看Requests库官方文档url

没有别的指南了,你如今要靠本身了

祝你好运

相关文章
相关标签/搜索