数据库界的《延禧攻略》来了，不看你就输了

时间 2019-11-24

标签数据库延禧攻略不看栏目 SQL 繁體版

原文原文链接

胜者为王，败者为寇这种思想好像从古代就一直延续到今日。非要分出个胜负，分出个谁好，谁坏才罢休。mysql

在数据库领域也会有此类问题，我混迹开源数据库圈多年。MySQL 数据库占领着开源数据库的头把交椅，MongoDB 占领着 NoSQL 数据库的第一位。sql

咱们来看下数据库的总体排名状况：数据库

二者都是第一，因此总会拿来比较。也会常常被人问及到诸如此类的问题 MongoDB 4.0 已经问世了，并且支持事务了，是否是未来能够取代 MySQL 了。数组

MySQL 和 MongoDB 哪一个数据库好用？今天想经过这篇文章，带着你们全方位解读 MySQL 与 MongoDB 的区别。让有困惑的老铁们明白，没有谁替代谁，只有哪一个场景更适合谁。bash

只有更了解彼此，才能更好地利用它们的功能性，下面我从四个方向依次阐明二者的区别：服务器

数据库概述
平常运维管理维度
集群架构层面
应用场景角度

数据库概述数据结构

咱们先来了解一下 MySQL 数据库，以下图：架构

接下来学习一下 MySQL 数据库的特色，以下图：并发

MySQL 了解完后，咱们再来了解 MongoDB 及其特色的介绍：运维

MongoDB 特色介绍，以下图：

根据上文图解，咱们对二者数据库都有了必定的认识，接下来咱们从运维的角度来检验二者的不一样。

平常运维管理维度

术语和概念的差别

从上图能够看出，关系型数据库中的“表”，在 MongoDB 中叫作集合。“行”在 MongoDB 中叫作文档。因此咱们管 MongoDB 叫作文档型数据库。

存储数据结构的差别

在关系型数据库中设计表，有些信息须要多表记录。而在 MongoDB 中，上面的三张表，就变成下面的这一段代码就能够实现了。

{ _id:"M416", name:"zhangsu", phone:[1234,5678], ..... } 复制代码

MongoDB 表设计的特色以下：

数据聚合
数据嵌套
数组结构

启动配置文件格式差别

MySQL 数据库的配置叫作 my.cnf，咱们来看下它的记录方式，代码以下：

[client] port    = 3306 socket  = /data/mysql/mysql.sock  [mysql] prompt="\u@db \R:\m:\s [\d]> " no-auto-rehash  [mysqld] user    = mysql port    = 3306 basedir = /usr/local/mysql datadir = /data/mysql/ socket  = /data/mysql/mysql.sock pid-file = db.pid character-set-server = utf8mb4 skip_name_resolve = 1 open_files_limit    = 65535 back_log = 1024 max_connections = 512 max_connect_errors = 1000000 table_open_cache = 1024 table_definition_cache = 1024 table_open_cache_instances = 64 thread_stack = 512K external-locking = FALSE max_allowed_packet = 32M sort_buffer_size = 4M join_buffer_size = 4M thread_cache_size = 768 #query_cache_size = 0 #query_cache_type = 0 interactive_timeout = 600 wait_timeout = 600 tmp_table_size = 32M max_heap_table_size = 32M slow_query_log = 1 slow_query_log_file = /data/mysql/slow.log log-error = /data/mysql/error.log long_query_time = 0.1 server-id = 3306101 log-bin = /data/mysql/mybinlog sync_binlog = 1 binlog_cache_size = 4M max_binlog_cache_size = 1G max_binlog_size = 1G expire_logs_days = 7 master_info_repository = TABLE relay_log_info_repository = TABLE gtid_mode = on enforce_gtid_consistency = 1 log_slave_updates=1 binlog_format = row relay_log_recovery = 1 relay-log-purge = 1 key_buffer_size = 32M read_buffer_size = 8M read_rnd_buffer_size = 4M bulk_insert_buffer_size = 64M #myisam_sort_buffer_size = 128M #myisam_max_sort_file_size = 10G #myisam_repair_threads = 1 lock_wait_timeout = 3600 explicit_defaults_for_timestamp = 1 innodb_thread_concurrency = 0 innodb_sync_spin_loops = 100 innodb_spin_wait_delay = 30 secure_file_priv='' super_read_only=0 transaction_isolation = REPEATABLE-READ #innodb_additional_mem_pool_size = 16M innodb_buffer_pool_size = 1024M innodb_buffer_pool_instances = 8 innodb_buffer_pool_load_at_startup = 1 innodb_buffer_pool_dump_at_shutdown = 1 innodb_data_file_path = ibdata1:100M:autoextend innodb_flush_log_at_trx_commit = 1 innodb_log_buffer_size = 32M innodb_log_file_size = 2G innodb_log_files_in_group = 2 innodb_max_undo_log_size = 4G innodb_io_capacity = 4000 innodb_io_capacity_max = 8000 innodb_flush_neighbors = 0 innodb_write_io_threads = 8 innodb_read_io_threads = 8 innodb_purge_threads = 4 innodb_page_cleaners = 4 innodb_open_files = 65535 innodb_max_dirty_pages_pct = 50 innodb_flush_method = O_DIRECT innodb_lru_scan_depth = 4000 innodb_checksum_algorithm = crc32 #innodb_file_format = Barracuda #innodb_file_format_max = Barracuda innodb_lock_wait_timeout = 10 innodb_rollback_on_timeout = 1 innodb_print_all_deadlocks = 1 innodb_file_per_table = 1 innodb_online_alter_log_max_size = 4G internal_tmp_disk_storage_engine = InnoDB innodb_stats_on_metadata = 0 innodb_status_file = 1 [mysqldump] quick max_allowed_packet = 32M 复制代码

MongoDB 配置文件使用 Yaml 格式，以下图：

增删改查操做的差别

事务支持的差别

但随着 MongoDB 4.0 的问世，它将支持多文档事务，届时 MongoDB 将成为惟一可以同时支持速度，灵活性，JSON 文档模型和 ACID 数据完整性保证的数据库。

所谓的多文档事务，能够理解为关系型数据库的多行事务。在关系型的事务支持中，你们几乎无一例外支持同一事务内操做的原子性，即要么所有提交，要么所有回滚。

这个同一事务内能够有多个操做，针对于多个表，或者是同一个表内的多行数据。

总结：随着事务支持的增长，MongoDB 功能上更接近于关系型数据库，可是和关系型仍是有本质上的区别。

MySQL 是基于关系模型的数据库，对各类数据多变的场景如物联网或社交化并无 MongoDB 支持得好。

MongoDB 的 JSON 模型则具备动态灵活，数据库无须下线就能够进行模式变迁升级，在这种场景下面，选择 MongoDB 会特别合适。

备份上的差别

MySQL备份方式，以下图：

MongoDB备份方式（逻辑备份与恢复）：

mongodump
mongorestore
mongoexport
mongoimport

注：MongoDB 目前为止尚未像 xtrabackup 这样好用的备份工具。因此通常来讲，都是使用逻辑备份方式来进行操做。

从运维角度咱们对它们有了更深的认识以后，咱们来从集群架构的维度出发，去探究更深的不一样之处。

集群架构层面

集群架构层面上的差别

咱们先从 MySQL 复制的角度入手，而后再介绍 MySQL 高可用集群架构。

MySQL 主从复制原理图以下：

MySQL 复制种类总结

异步复制：一般没说明指的都是异步，即主库执行完 Commit 后，在主库写入 Binlog 日志后便可成功返回客户端，无需等 Binlog 日志传送给从库，一旦主库宕机，有可能会丢失日志。

半同步复制：MySQL 5.5 版本以后引入了半同步复制功能，主从服务器必须同时安装半同步复制插件，才能开启该复制功能。

在该功能下，确保从库接收完主库传递过来的 Binlog 内容已经写入到本身的 Relay Log 里面了，才会通知主库上面的等待线程，该操做完毕。

若是等待超时，超过 rpl_semi_sync_master_timeout 参数设置的时间，则关闭半同步复制，并自动转换为异步复制模式，直到至少有一台从库通知主库已经接收到 Binlog 信息了为止。

多源复制：所谓多源复制，就是把多台主库的数据同步到一台从库服务器上，从库会建立通往每一个主库的管道。

在 MySQL 5.7 以前的版本中，只能实现一主一从、一主多从或者多主多从的复制架构，若是想要实现多主一从的复制，只能使用 MariaDB。MySQL 5.7 版本已经能够实现多主一从的复制。

并行复制：使用 MySQL 5.7 的并行复制功能。在 5.6 版本中就有了并行的概念，但它的并行复制是基于库级别的，即 slave_parallel_type=database。在这种模式下，只是基于多库少表的状况，并不适用于真实的生产环境。

在 MySQL 5.7 版本中，真正实现了基于组提交的并行复制，简单说就是主库并行执行 SQL 语句，从库也能够经过多个 Workers 线程并发执行 Relay Log 中主库提交的事务。

想要开启 MySQL 5.7 的并行复制能够在从库设置参数 slave_parallel_workers > 0。

并把 5.7 版本中新添加的 slave_parallel_type 参数设置为 LOGICAL_CLOCK。

该参数有 DATABASE 和 LOGICAL_CLOCK 两个值。MySQL 5.6 默认是 DATABASE。

MySQL 高可用集群架构

MySQL 高可用集群架构分类图以下：

MHA

MHA 集群架构图

MHA 的目的在于维持 MySQL Replication 中 Master 库的高可用性，它最大特色是能够修复多个 Slave 之间的差别日志，最终使全部 Slave 保持数据一致，而后从中选择一个充当新的 Master，并将其余 Slave 指向它。

当 Master 出现故障时，能够经过对比 Slave 之间 I/O thread 读取主库 Binlog 的 Position 号，选取最接近的 Slave 做为备选主库（备胎）。其余的从库能够经过与备选主库对比生成差别的中继日志。

在备选主库上应用从原来 Master 保存的 Binlog，同时将备选主库提高为 Master。最后在其余 Slave 上应用相应的差别中继日志并重新的 Master 开始复制。

双主+Keepalived

企业中小型规模的时候，采用这种架构是最省事的。两个节点能够采用简单的一主一从模式，或者双主模式。

而且，它们放置于同一个 VLAN 中，在 Master 节点发生故障后，利用 Keepalived / Heartbeat 的高可用机制实现快速切换到 Slave 节点。

PXC 集群

PXC 是基于 Galera 协议的 MySQL 高可用集群架构。Galera 产品是以 Galera Cluster 方式为 MySQL 提供高可用集群解决方案的。Galera Cluster 就是集成了 Galera 插件的 MySQL 集群。

Galera replication 是 Codership 提供的 MySQL 数据同步方案，具备高可用性，方便扩展。

而且它能够实现多个 MySQL 节点间的数据同步复制与读写，可保障数据库的服务高可用及数据强一致性。

MGR 架构

MySQL 官方在 5.7.17 版本正式推出组复制（MySQL Group Replication，简称MGR）。Master1，Master2，Master3，全部成员独立完成各自的事务。

当客户端先发起一个更新事务，该事务先在本地执行，执行完成以后就要发起对事务的提交操做了。

在尚未真正提交以前须要将产生的复制写集广播出去，复制到其余成员。若是冲突检测成功，组内决定该事务能够提交，其余成员能够应用，不然就回滚。

最终，这意味着全部组内成员以相同的顺序接收同一组事务。所以组内成员以相同的顺序应用相同的修改，保证组内数据强一致性。

MongoDB 的复制状况

MongoDB 复制集，以下图：

三副本架构是最基础的复制集的架构，一主两备模式。主节点接受外界的读写请求，向备节点进行数据同步。当主节点宕掉，会自动切换到备节点，不影响线上业务，防止单点故障。

MongoDB 复制集自动切换，以下图：

副本集的全部成员均可以接受读取操做。可是，默认状况下，应用程序将其读取操做指向 Primary。

副本集能够有至多一个 Primary 节点，Primary 节点宕机后，集群会触发选举以选出新的 Primary 节点。

在如下三成员节点副本集架构中，Primary 宕机后，触发了一次选举，从剩下的两个 Secondary 节点里，选举出了一个新的 Primary 节点。

MongoDB 复制集读写分离设置，以下图：

Read Preference 决定 MongoDB 客户端从哪一个节点上读取数据。默认状况下，应用程序将其读取操做指向副本集中的 Primary 节点。

指定 Read Preference 选项时要注意：由于使用异步复制，复制延迟会致使 Secondary 上的数据可能不是最新的。

默认状况下，复制集的全部读请求都发到 Primary，Driver 可经过设置 Read Preference 来将读请求路由到其余的节点：

Primary：默认规则，全部读请求发到 Primary。
PrimaryPreferred：Primary 优先，若是 Primary 不可达，请求 Secondary。
Secondary：全部的读请求都发到 Secondary。
SecondaryPreferred：Secondary 优先，当全部 Secondary 不可达时，请求 Primary。
Nearest：读请求发送到最近的可达节点上（经过 Ping 探测得出最近的节点）。

MongoDB 分片架构以下图：

分片是一种在多台机器上分配数据的方法。MongoDB 使用分片架构有助于您去管理很是大数量的数据集和高吞吐量操做的集群。

大数据量和高吞吐量的业务状况对单台服务器来说是具有很大的挑战性的。例如，高查询率可能耗尽服务器的 CPU 容量。

工做集大小超过系统内存，那么压力会给到磁盘上，这对 IO 来说不是咱们所但愿看到的。MongoDB 支持经过分片进行水平缩放。

总结：MySQL 的复制种类不少，集群架构在选择性上来讲也比较多。但横向扩展能力上，没有 MongoDB 的分片架构扩展能力强。

最后，咱们经过 MySQL 与 MongoDB 不一样的应用场景来对两种数据库作一个总结。

应用场景角度

正如开篇介绍 MySQL 特色时所说的，MySQL 使用得覆盖率已经接近 100%。

从大型 BAT，电商平台，游戏公司，甚至诸多传统行业也无不例外都在往 MySQL 数据库方向靠拢，达到逐渐垄断的趋势。

对于 MongoDB 的应用也已经蔓延到各个领域，好比游戏、物流、电商、内容管理、社交、物联网、视频直播等：

游戏领域：使用 MongoDB 存储游戏用户信息，用户的装备、积分等直接之内嵌文档的形式存储，方便查询、更新。

物流场景：使用 MongoDB 存储订单信息，订单状态在运送过程当中会不断更新，以 MongoDB 内嵌数组的形式来存储，一次查询就能将订单全部的变动读取出来。

社交场景：使用 MongoDB 存储用户信息，以及用户发表的朋友圈信息，经过地理位置索引实现附近的人、地点等功能。

物联网场景：使用 MongoDB 存储全部接入的智能设备信息，以及设备汇报的日志信息，并对这些信息进行多维度的分析。

我 2009 年开始接触 MySQL，在 2012 年接触 MongoDB 的第一个版本 2.1，对于这两个数据库真的是手心手背都是肉。

在我孤独寂寞的时候，都是它们一直陪伴着我，感谢技术给咱们带来的简单快乐。

不管将来发展如何，没有所谓的谁会替代谁，只是说它们各自都有不一样的特色，促使在不一样的应用场景下，咱们使用谁更合适而已。

这里没有宫廷内斗，没有尔虞我诈，只有那份最简单地作技术的心，是现实版的《延禧攻略》！

张甦，数据库领域的专家和知名人士、图书《MySQL王者晋级之路》做者，51CTO 专家博主。近 10 年互联网线上处理及培训经验，专一于 MySQL 数据库，对 MongoDB、Redis 等 NoSQL 数据库以及 Hadoop 生态圈相关技术有深刻研究，具有很是丰富的理论与实战经验。
原文：http://database.51cto.com/art/201808/582300.htm