小白学 Python 爬虫(5):前置准备(四)数据库基础

人生苦短,我用 Python

前文传送门:python

小白学 Python 爬虫(1):开篇mysql

小白学 Python 爬虫(2):前置准备(一)基本类库的安装linux

小白学 Python 爬虫(3):前置准备(二)Linux基础入门git

小白学 Python 爬虫(4):前置准备(三)Docker基础入门github

本篇文章,咱们接着介绍基础内容,数据库。redis

爬虫将数据爬取完成后,总要有地方存放吧,这个数据存在哪里呢?sql

固然是数据库中,那个说放在 Excel 里的,你给我站住!docker

固然 Excel 也是可使用的,而且第三方也对 Excel 的操做提供了类库支持,可是,SQL 库仍是一个老码农的坚持。数据库

数据库如今分为关系型数据库,非关系型数据库和新型数据库。segmentfault

仍是换英文吧,说中文感受不大对,防止小编说错,下面使用英文再介绍一遍。

  • SQL(Structured Query Language):数据库,指关系型数据库。主要表明: SQL Server 、 Oracle 、 MySQL 、 PostgreSQL 。
  • NoSQL(Not Only SQL):泛指非关系型数据库。主要表明: MongoDB 、 Redis 、 CouchDB 。
  • NewSQL:对各类新的可扩展/高性能数据库的简称。主要表明: Clustrix 、 GenieDB 、 TiDB 。

本系列文章会用到的数据库主要有 Mysql 和 Redis 。

下面,咱们开始愉快的装起来。

Mysql 安装

Mysql 在 Win 环境下,能够找到 .exe 的安装包,可是小编不建议你们这么直接安装,这时,前面咱们介绍的 Docker 就排上用场了,咱们介绍如何在 Docker 中安装 Mysql 。

本文系统环境将使用 Linux ,固然,在 Windows 下经过 Docker 安装过程和命令基本一致。

首先,是将 Mysql 的镜像从镜像仓库中下载到本地:

docker pull mysql:5.7

静静的等待进度条走完,而后咱们使用命令查看下刚才下载的镜像:

docker images

若是能够看到上图这样的显示就说明下载成功了,剩下的只须要咱们来启动这个 Mysql 的镜像了。

docker run --name mysql --restart=always -p 3306:3306 -v /www/mysql/conf.d:/etc/mysql/conf.d -v /www/mysql/mysql.conf.d:/etc/mysql/mysql.conf.d -v /www/mysql/datadir:/var/lib/mysql -e MYSQL_ROOT_PASSWORD=123456 -e TZ=Asia/Shanghai -d mysql:5.7

我来解释一下这里面的几个参数的含义:

--name:这里是命名启动后容器名称。
--restart:自动重启,好比服务器忽然断电,重启服务器以后不须要从新手动启动。
-p:指定端口号。
-v:挂载。容器中的配置包括数据是不能直接访问的,可是能够将这些内容挂在到咱们本身本机的目录中,小编这里的目录使用的是 linux 的文件目录,各位同窗若是要在 win 的电脑上操做记得修改。
-e:配置数据库的 root 密码和指定时区是亚洲的上海。
-d:做为守护线程。

而后就结束了,咱们的 Mysql 就安装完成了,能够经过命令查看一下容器是否正常启动。

docker ps

顺利完成!是否是感受很简单,咱们只须要三个命令就搭建了一个单机版的 Mysql 服务。并且在不一样的系统中经过 Docker 安装,命令近乎一致。

可是 Mysql 装好了,咱们怎么看里面的数据呢?这个能够安装一个客户端软件,叫作 Navicat ,惋惜是收费的,并且还蛮贵的,那么怎么用就不用我多说了吧,本身悟。

界面仍是蛮清爽的,操做也十分简单,毕竟有中文版,具体怎么操做各位同窗本身点点看大体就知道了。

另外,建议各位同窗在 Linux 中安装 Mysql 。

Redis 安装

首先来介绍下 Redis 。

Redis 咱们通常是将其当成缓存来使用的,由于它的数据是存在内存中,因此它的读写速度要远远超出 MySQL,数据在内存中,意味着一旦断电重启后,将会丢失全部数据。

Redis 一样提供将数据持久化到硬盘,可是开启数据持久化到硬盘后,将会有效下降 Redis 的性能。

一样,咱们在 Docker 中安装 Redis 。

下载 Redis :

docker pull redis

这里先建立一个文件夹用来作 Redis 的挂载目录,小编这里建立的文件夹目录为 /www/redis/ ,用来存放redis的配置文件、数据等。

Redis 的启动命令为:

docker run -d -p 6379:6379 --restart=always -v /www/redis/conf/redis.conf:/usr/local/etc/redis/redis.conf -v /www/redis/data:/data --name docker-redis redis --appendonly yes

Redis 的配置文件这里小编就不贴出来了,属实太长了,上传至代码仓库,有须要的同窗自取吧。

顺便这个 Redis 缓存服务给你们作个共享,在公众号回复 redis 获取缓存服务配置。

硬件负载较低,本共享仅作测试使用,但愿各位同窗不要作压测等高危操做。

Excel 安装

目前 Office 也是更新至了 2019 版,具体怎么装我就很少讲了,只讲一个词: Office Tool ,懂的天然懂,不懂的就去百度下,百度这个必然不会让你失望的。

链接库安装

上面咱们讲完了数据库的安装,若是咱们想使用 Python 链接到这些数据库上,还须要一些第三方提供的类库。

PyMySQL

在 Python 中,想要链接到 MySQL 进行操做,就须要安装 PyMySQL 。

安装命令以下:

pip install pymysql

redis-py

在 Python 中,想要链接到 Redis 进行操做,就须要安装 redis-py 。

安装命令以下:

pip install redis

本篇内容到这里就结束,但愿各位同窗能够亲自动手实践一下,谢谢~~~。

示例代码

示例代码-Github

示例代码-Gitee

若是个人文章对您有帮助,请扫码关注下做者的公众号:获取最新干货推送:)

相关文章
相关标签/搜索