mongodb，redis，memcached，mysql对比

时间 2019-11-17

标签 mongodb redis memcached mysql 对比栏目 MongoDB 繁體版

原文原文链接

一、性能
都比较高，性能对咱们来讲应该都不是瓶颈
整体来说，TPS方面redis和memcache差很少，要大于mongodbnode

二、操做的便利性
memcache数据结构单一
redis丰富一些，数据操做方面，redis更好一些，较少的网络IO次数
mongodb支持丰富的数据表达，索引，最相似关系型数据库，支持的查询语言很是丰富
mysql是持久化存储，存放在磁盘里面，检索的话，会涉及到必定的IO瓶颈。
推理到redis+mysql，它是内存+磁盘关系的一个映射，mysql放在磁盘，redis放在内存，这样的话，web应用每次只访问redis，若是没有找到的数据，才去访问Mysql。mysql

三、内存空间的大小和数据量的大小
redis在2.0版本后增长了本身的VM特性，突破物理内存的限制；能够对key value设置过时时间（相似memcache）
memcache能够修改最大可用内存,采用LRU算法
mongoDB适合大数据量的存储，依赖操做系统VM作内存管理，采用镜像文件存储，吃内存也比较厉害，服务不要和别的服务在一块儿，官方建议独立部署在64位系统（32位有最大2.5G文件限制，64位没有改限制）linux

当物理内存不够用的时候，redis和mongodb都会使用虚拟内存。当物理内存和虚拟内存都不够用的时候，估计除了mysql你没什么好选择了。其实，从数据存储原理来看，我更倾向于将mongodb归类为硬盘数据库，可是使用了mmap做为加速的手段而已。web

四、可用性（单点问题）
对于单点问题，
redis，依赖客户端来实现分布式读写；主从复制时，每次从节点从新链接主节点都要依赖整个快照,无增量复制，因性能和效率问题，因此单点问题比较复杂；不支持自动sharding,须要依赖程序设定一致hash 机制。
一种替代方案是，不用redis自己的复制机制，采用本身作主动复制（多份存储），或者改为增量复制的方式（须要本身实现），一致性问题和性能的权衡。
Memcache自己没有数据冗余机制，也不必；对于故障预防，采用依赖成熟的hash或者环状的算法，解决单点故障引发的抖动问题。
mongoDB支持master-slave,replicaset（内部采用paxos选举算法，自动故障恢复）,auto sharding机制，对客户端屏蔽了故障转移和切分机制。MongoDB优于Redis；单点问题上，MongoDB应用简单，相对用户透明，Redis比较复杂，须要客户端主动解决。（MongoDB 通常会使用replica sets和sharding功能结合，replica sets侧重高可用性及高可靠性，而sharding侧重于性能、易扩展）redis

五、可靠性（持久化）
对于数据持久化和数据恢复，
redis支持（快照、AOF）：依赖快照进行持久化，aof加强了可靠性的同时，对性能有所影响
memcache不支持，一般用在作缓存,提高性能；
MongoDB从1.8版本开始采用binlog方式（MySQL一样采用该方式）支持持久化的可靠性,mongodb的全部数据其实是存放在硬盘的，全部要操做的数据经过mmap的方式映射到内存某个区域内。mmap数据flush到硬盘以前，系统宕机了，数据就会丢失。算法

六、数据一致性（事务支持）
Memcache 在并发场景下，用cas保证一致性
redis事务支持比较弱，只能保证事务中的每一个操做按顺序连续执行
mongoDB不支持事物，靠客户端自身保证sql

七、数据分析
mongoDB内置了数据分析的功能(mapreduce),其余不支持mongodb

八、应用场景
redis：数据量较小的更性能操做和运算上，
memcache：用于在动态系统中减小数据库负载，提高性能;作缓存，提升性能（适合读多写少，对于数据量比较大，能够采用sharding）
MongoDB:主要解决海量数据的访问效率问题数据库

11.数据结构：
memcache只是提供了简单的数据结构，好比 string存储。
Redis不只仅支持简单的k/v类型的数据，同时还提供 string（字符串）、 list(双向链表)、dict(hash表)、set(集合）、zset(排序set)、hyperloglog（基数估算）等数据结构的存储。。编程

Mongodb和Memcached不是一个范畴内的东西。Mongodb是文档型的非关系型数据库，其优点在于查询功能比较强大，能存储海量数据。Mongodb 和 Memcached不存在谁替换谁的问题。

Memcached 和 Redis它们都是内存型数据库，数据保存在内存中，经过tcp直接存取，优点是速度快，并发高。

Memcached 是一个高性能的分布式内存对象缓存系统，用于动态Web应用以减轻数据库负载。它经过在内存中缓存数据和对象来减小读取数据库的次数，从而提供动态、数据库驱动网站的速度。

Memcached 的分布式不是在服务器端实现的，而是在客户端应用中实现的，即经过内置算法制定目标数据的节点，Memcached 的分布式是基于客户端的Key的hash来作均衡，是个伪分布式的系统。

Redis是一个key-value存储系统。和 Memcached 相似，它支持存储的value类型相对更多，包括string(字符串)、 list(链表)、set(集合)和zset(有序集合)。这些数据类型都支持push/pop、add/remove及取交集并集和差集及更丰富的操做，并且这些操做都是原子性的。在此基础上，Redis支持各类不一样方式的排序。与 Memcached 同样，为了保证效率，数据都是缓存在内存中。区别的是Redis会周期性的把更新的数据写入磁盘或者把修改操做写入追加的记录文件。

总结：
    • 没有必要过于关注性能，由于两者的性能都已经足够高了。因为Redis只使用单核，而Memcached可使用多核，Memcached能够利用多核优点，单实例吞吐量极高，能够达到几十万QPS（取决于key、value的字节大小以及服务器硬件性能，平常环境中QPS高峰大约在4-6w左右），适用于最大程度扛量，因此两者比较起来，平均每个核上，Redis在存储小数据时比Memcached性能更高。而在100k以上的数据中，Memcached性能要高于Redis。虽然Redis最近也在存储大数据的性能上进行优化，可是比起Memcached，仍是稍有逊色。说了这么多，结论是，不管你使用哪个，每秒处理请求的次数都不会成为瓶颈。
• 在内存使用效率上，若是使用简单的key-value存储，Memcached的内存利用率更高。而若是Redis采用hash结构来作key-value存储，因为其组合式的压缩，其内存利用率会高于Memcached。固然，这和你的应用场景和数据特性有关。
    • 若是你对数据持久化和数据同步有所要求，那么推荐你选择Redis。由于这两个特性Memcached都不具有。即便你只是但愿在升级或者重启系统后缓存数据不会丢失，选择Redis也是明智的。
    • 固然，最后还得说到你的具体应用需求。Redis相比Memcached来讲，拥有更多的数据结构，并支持更丰富的数据操做。一般在Memcached里，你须要将数据拿到客户端来进行相似的修改再set回去。这大大增长了网络IO的次数和数据体积。在Redis中，这些复杂的操做一般和通常的GET/SET同样高效。因此，若是你须要缓存可以支持更复杂的结构和操做，那么Redis会是不错的选择。

• memcached支持直接配置为session handle

>>Memcached的局限性：
只支持简单的key/value数据结构，不像Redis能够支持丰富的数据类型。
没法进行持久化，数据不能备份，只能用于缓存使用，且重启后数据所有丢失。
没法进行数据同步，不能将MC中的数据迁移到其余MC实例中。
Memcached内存分配采用Slab Allocation机制管理内存，value大小分布差别较大时会形成内存利用率下降，并引起低利用率时依然出现踢出等问题。须要用户注重value设计。

>>Redis的局限性：
Redis只能使用单线程，性能受限于CPU性能，故单实例CPU最高才可能达到5-6wQPS每秒（取决于数据结构，数据大小以及服务器硬件性能，平常环境中QPS高峰大约在1-2w左右）,并发状况下不须要考虑数据一致性问题，。
支持简单的事务需求，但业界使用场景不多，并不成熟，既是优势也是缺点。
Redis在string类型上会消耗较多内存，可使用dict（hash表）压缩存储以下降内存耗用。
Mc和Redis都是Key-Value类型，不适合在不一样数据集之间创建关系，也不适合进行查询搜索。好比redis的keys pattern这种匹配操做，对redis的性能是灾难。

>>mongoDB
mongoDB 是一种文档性的数据库。先解释一下文档的数据库，便可以存放xml、json、bson类型系那个的数据。
这些数据具有自述性（self-describing），呈现分层的树状数据结构。redis能够用hash存放简单关系型数据。
mongoDB 存放json格式数据。
适合场景：事件记录、内容管理或者博客平台，好比评论系统。

MongoDB和Redis区别
MongoDB更相似Mysql，支持字段索引、游标操做，其优点在于查询功能比较强大，擅长查询xml、json、bson数据，能存储海量数据，可是不支持事务。
Mysql在大数据量时效率显著降低，MongoDB更多时候做为关系数据库的一种替代。

内存管理机制
Redis数据所有存在内存，按期写入磁盘，当内存不够时，能够选择指定的LRU算法删除数据。
MongoDB数据存在内存，由linux系统mmap实现，当内存不够时，只将热点数据放入内存，其余数据存在磁盘。

支持的数据结构
Redis支持的数据结构丰富，包括hash、set、list等。
MongoDB数据结构比较单一，可是支持丰富的数据表达，索引，最相似关系型数据库，支持的查询语言很是丰富。

性能
两者性能都比较高，应该说都不会是瓶颈。

可靠性
两者均支持持久化。

集群
MongoDB集群技术比较成熟，Redis从3.0开始支持集群。

不适用场景
Ø 须要使用复杂sql的操做
Ø 事务性系统

Redis很适合用来作缓存，但除此以外，它实际上还能够在一些“读写分离”的场景下做为“读库”来用，特别是用来存放Hadoop或Spark的分析结果。
Redis的读写性能在100,000 ops/s左右，时延通常为10～70微妙左右；而HBase的单机读写性能通常不会超过1,000ops/s，时延则在1～5毫秒之间。
Redis的魅力还在于它不像HBase只支持简单的字符串，他还支持集合set，有序集合zset和哈希hash
Redis适合存储全局变量，好比微信token每两小时刷新一次，就比较适合用redis存储，读也比较方便。
hbase是列数据库，不支持二级索引，写性能高，适合写多读少的业务场景，可用来存储BI数据。
mongodb 适合存储json类型数据，不常常变化，好比排行榜，天天刷新一次，remove一次再从db更新过去。Hbase暂时没用过。
mongodb主要是作社交这一类的应用。redis是个in memory cache，主要做为软件里一个部件来提高总体性能的。

MongoDB在A:{B,C}上创建索引，查询A:{B,C}和A:{C,B}都会使用索引吗？不会，只会在A:{B,C}上使用索引。
为何MongoDB的数据文件很大？MongoDB采用的预分配空间的方式来防止文件碎片。

Redis的局限性：
(1)Redis只能使用单线程，性能受限于CPU性能，故单实例CPU最高才可能达到5-6wQPS每秒（取决于数据结构，数据大小以及服务器硬件性能，平常环境中QPS高峰大约在1-2w左右）。
(2)支持简单的事务需求，但业界使用场景不多，并不成熟，既是优势也是缺点。
(3)Redis在string类型上会消耗较多内存，可使用dict（hash表）压缩存储以下降内存耗用。
(4)Mc和Redis都是Key-Value类型，不适合在不一样数据集之间创建关系，也不适合进行查询搜索。好比redis的keys pattern这种匹配操做，对redis的性能是灾难。

MongoDB 与 MySQL 的适用场景：
MongoDB 的适用场景为：数据不是特别重要（例如通知，推送这些），数据表结构变化较为频繁，数据量特别大，数据的并发性特别高，数据结构比较特别（例如地图的位置坐标），这些状况下用 MongoDB ，其余状况就仍是用 MySQL ，这样组合使用就能够达到最大的效率。
1.若是须要将 MongoDB 做为后端 db 来代替MySQL使用，即这里 MySQL 与 MongoDB 属于平行级别，那么，这样的使用可能有如下几种状况的考量：
(1)MongoDB 所负责部分以文档形式存储，可以有较好的代码亲和性，json 格式的直接写入方便。(如日志之类)
(2)从 data models 设计阶段就将原子性考虑于其中，无需事务之类的辅助。开发用如 nodejs 之类的语言来进行开发，对开发比较方便。
(3)MongoDB 自己的 failover 机制，无需使用如 MHA 之类的方式实现。

2.将 MongoDB 做为相似 Redis，memcache 来作缓存db，为 MySQL 提供服务，或是后端日志收集分析。考虑到 MongoDB 属于 No SQL 型数据库，SQL 语句与数据结构不如 MySQL 那么亲和，也会有不少时候将 MongoDB 作为辅助MySQL 而使用的类 Redis memcache 之类的缓存db来使用。亦或是仅做日志收集分析。
MongoDB 有一个最大的缺点，就是它占用的空间很大，由于它属于典型空间换时间原则的类型。那么它的磁盘空间比普通数据库会浪费一些，并且到目前为止它尚未实如今线压缩功能，在 MongoDB 中频繁的进行数据增删改时，若是记录变了，例如数据大小发生了变化，这时候容易产生一些数据碎片，出现碎片引起的结果，一个是索引会出现性能问题。
另一个就是在必定的时间后，所占空间会莫明其妙地增大，因此要按期把数据库作修复，按期从新作索引，这样会提高MongoDB 的稳定性和效率。

1.MySQL 来自女儿的名字； MongoDB 来自 humongous
2.MySQL 使用 Table/Row/Column； MongoDB 使用 Collection/Document
3.MySQL 须要指定 table 的 schema； MongoDB的 collection 的每一个 document 的 schema 能够自由修改
4.MySQL 支持 join； MongoDB 没有 join
5.MySQL 使用 SQL 语言； MongoDB 使用相似 JavaScript 的函数

命令对比
MongoDB 与 MySQL 命令对比传统的关系数据库通常由数据库（database）、表（table）、记录（record）三个层次概念组成，MongoDB 是由数据库（database）、集合（collection）、文档对象（document）三个层次组成。MongoDB对于关系型数据库里的表，可是集合中没有列、行和关系概念，这体现了模式自由的特色。
MongoDB (文档型数据库)：提供可扩展的高性能数据存储
一、基于分布式文件存储
二、高负载状况下添加更多节点，能够保证服务器性能
三、将数据存储为一个文档
MongoDB 与 MySQL 的比较
一、稳定性
二、索引，索引放在内存中，可以提高随机读写的性能。若是索引不能彻底放在内存，一旦出现随机读写比较高的时候，就会频繁地进行磁盘交换，MongoDB 的性能就会急剧降低
三、占用的空间很大，由于它属于典型空间换时间原则的类型。那么它的磁盘空间比普通数据库会浪费一些，并且到目前为止它尚未实如今线压缩功能，
在 MongoDB 中频繁的进行数据增删改时，若是记录变了，例如数据大小发生了变化，这时候容易产生一些数据碎片，出现碎片引起的结果，
一个是索引会出现性能问题，
另一个就是在必定的时间后，所占空间会莫明其妙地增大，因此要按期把数据库作修复，按期从新作索引，这样会提高MongoDB 的稳定性和效率。
在最新的版本里，它已经在实如今线压缩，估计应该在2.0版左右，应该可以实如今线压缩，能够在后台执行如今repair DataBase 的一些操做。若是那样，就解决了目前困扰咱们的大问题。
四、MongoDB 对数据间的事务关系支持比较弱
五、运维不方便
MongoDB 相对于 MySQL 的优点
1. 适合那些对数据库具体数据格式不明确或者数据库数据格式常常变化的需求模型，并且对开发者十分友好。
2. 自带一个分布式文件系统，能够很方便地部署到服务器机群上。
MongoDB 里有一个Shard的概念，就是方便为了服务器分片使用的。每增长一台Shard，MongoDB 的插入性能也会以接近倍数的方式增加，磁盘容量也很能够很方便地扩充。
3. 自带了对map-reduce运算框架的支持，这也很方便进行数据的统计。相似于group by
MongoDB 与 MySQL 命令对比传统的关系数据库通常由数据库（database）、表（table）、记录（record）三个层次概念组成，
MongoDB 是由数据库（database）、集合（collection）、文档对象（document）三个层次组成。
MongoDB 对于关系型数据库里的表，可是集合中没有列、行和关系概念，这体现了模式自由的特色。

MongoDB优势：
1.MongoDB很是容易被扩展，这也为写代码带来了极大的方便。
1.性能优越:快速！在适量级的内存的 MongoDB 的性能是很是迅速的，它将热数据存储在物理内存中，使得热数据的读写变得十分快，
2.高扩展:第三方支持丰富(这是与其余的 No SQL 相比，MongoDB 也具备的优点)
3.自身的 Failover 机制！
4.弱一致性（最终一致），更能保证用户的访问速度
5.文档结构的存储方式，可以更便捷的获取数据: json 的存储格式
6.支持大容量的存储,内置 GridFS
7.内置 Sharding

MongoDB 缺点：
主要是无事物机制！
① MongoDB 不支持事务操做(最主要的缺点)
② MongoDB 占用空间过大
③ MongoDB 没有如 MySQL 那样成熟的维护工具，这对于开发和IT运营都是个值得注意的地方

MongoDB 的应用场景

主要特色：
MongoDB 的提供了一个面向文档存储，操做起来比较简单和容易。
你能够在 MongoDB 记录中设置任何属性的索引 (如：FirstName="Sameer",Address="8 Gandhi Road")来实现更快的排序。
你能够经过本地或者网络建立数据镜像，这使得 MongoDB 有更强的扩展性。
若是负载的增长（须要更多的存储空间和更强的处理能力），它能够分布在计算机网络中的其余节点上这就是所谓的分片。
MongoDB支持丰富的查询表达式。查询指令使用 JSON 形式的标记，可轻易查询文档中内嵌的对象及数组。
MongoDB使用update() 命令能够实现替换完成的文档（数据）或者一些指定的数据字段。
MongoDB中的Map/reduce 主要是用来对数据进行批量处理和聚合操做。
Map和Reduce。Map 函数调用 emit(key,value) 遍历集合中全部的记录，将 key 与 value 传给 Reduce 函数进行处理。
Map 函数和 Reduce 函数是使用 JavaScript 编写的，并能够经过 db.runCommand 或 mapreduce 命令来执行 MapReduce 操做。
GridFS 是 MongoDB 中的一个内置功能，能够用于存放大量小文件。
MongoDB 容许在服务端执行脚本，能够用 Javascript 编写某个函数，直接在服务端执行，也能够把函数的定义存储在服务端，下次直接调用便可。
MongoDB支持各类编程语言:RUBY，PYTHON，JAVA，C++，PHP，C# 等多种语言。

1. 它里面自带了一个名叫 GirdFS 的分布式文件系统，这就为 MongoDB 的部署提供了很大便利。而像 MySQL 这种比较早的数据库，虽然市面上有不少不一样的分表部署的方案，但这种终究不如 MongoDB 直接官方支持来得便捷实在。
2. 另外，MongoDB 内部还自建了对 map-reduce运算框架的支持，虽然这种支持从功能上看还算是比较简单的，至关于MySQL里 GroupBy 功能的扩展版，不过也为数据的统计带来了方便。
3. MongoDB 在启动后会将数据库中的数据以文件映射的方式加载到内存中。若是内存资源至关丰富的话，这将极大地提升数据库的查询速度，毕竟内存的 I/O 效率比磁盘高多了。
MongoDB 以 BSON 结构（二进制）进行存储，对海量数据存储有着很明显的优点。

监控
MongoDB提供了网络和系统监控工具Munin，它做为一个插件应用于MongoDB中。
Gangila是MongoDB高性能的系统监视的工具，它做为一个插件应用于MongoDB中。
基于图形界面的开源工具 Cacti, 用于查看CPU负载, 网络带宽利用率,它也提供了一个应用于监控 MongoDB 的插件。
查询语句：是独特的 MongoDB 的查询方式。
适合场景：事件的记录，内容管理或者博客平台等等。
架构特色：能够经过副本集，以及分片来实现高可用。
数据处理：数据是存储在硬盘上的，只不过须要常常读取的数据会被加载到内存中，将数据存储在物理内存中，从而达到高速读写。
成熟度与普遍度：新兴数据库，成熟度较低，No SQL 数据库中最为接近关系型数据库，比较完善的 DB 之一，适用人群不断在增加。

mongodb倒是一个“存储数据”的系统，增删改查数据的时候有“与或非”条件，查询数据的方式也能像SQL数据库同样灵活，这是redis所不具有的。
在个人项目中，redis做为session、任务队列的存储器，而mongodb做为数据（包括用户信息等）的存储器。
memcached能够随时执行“save”命令将当前redis的数据保存到硬盘上，另外redis也会根据配置自动存储数据到硬盘上。能够设置让redis再指定时间、指定更改次数时进行备份，生成RDB文件；而设置AOF，能够在操做或时间过程后将“日志”写入一个文件的最末，当操做愈来愈多，则AOF文件愈来愈大。

Mongodb与Redis应用指标对比
MongoDB和Redis都是NoSQL，采用结构型数据存储。两者在使用场景中，存在必定的区别，这也主要因为
两者在内存映射的处理过程，持久化的处理方法不一样。MongoDB建议集群部署，更多的考虑到集群方案，Redis
更偏重于进程顺序写入，虽然支持集群，也仅限于主-从模式。

在使用Redis过程当中，咱们发现了很多Redis不一样于Memcached，也不一样于MySQL的特征。
(本文主要讨论Redis未启用VM支持状况)

1. Schema
MySQL: 需事先设计
Memcached: 无需设计
Redis: 小型系统能够不用，可是若是要合理的规划及使用Redis，须要事先进行相似以下一些规划

数据项: value保存的内容是什么，如用户资料
Redis数据类型: 如String, List
数据大小: 如100字节
记录数: 如100万条(决定是否须要拆分)
⋯⋯
上面的规划就是一种schema，为何Redis在大型项目须要事先设计schema？由于Redis服务器有容量限制，数据容量不能超出物理内存大小，同时考虑到业务数据的可扩充性，记录数会持续增多、单条记录的内容也都会增加，所以须要提早规划好容量，数据架构师就是经过schema来判断当前业务的Redis是否须要“分库分表”以知足可扩展需求。

2. 容量及带宽规划
容量规划
MySQL: < 硬盘大小
Memcached: < RAM
Redis: < RAM

带宽规划
因为Redis比MySQL快10倍以上，所以带宽也是须要事先规划，避免带宽跑满而出现瓶颈。

3. 性能规划(QPS)
当系统读写出现瓶颈，一般如何解决？
MySQL
写: 拆分到多服务器
读: (1) 拆分 (2) 写少也能够经过增长Slave来解决

Memcached
读写: 都经过hash拆分到更多节点。

Redis:
写：拆分
读: (1) 拆分 (2) 写少也能够经过增长Slave来解决

4. 可扩展性
MySQL: 分库分表
Memcached: hash分布
Redis：也能够分库，也能够hash分布

小结
经过以上分析，Redis在不少方面同时具有MySQL及Memcached使用特征，在某些方面则更像MySQL。
因为Redis数据不能超过内存大小，一方面须要进行事先容量规划，保证容量足够；另一方面设计上须要防止数据规模无限制增长，进而致使Redis不可扩展。
Redis须要象MySQL同样预先设计好拆分方案。

小问题
在MySQL中，经过预先创建多表或者库能够在业务增加时候将这些表或库一分为二部署到更多服务器上。
在Redis中，“分库分表”应当如何实现？有什么好的设计模式？

redis读写原理：　　　　Redis只会缓存全部的key的信息，若是Redis发现内存的使用量超过了某一个阀值，将触发swap的操做，Redis根据“swappability = age*log(size_in_memory)”计算出哪些key对应的value须要swap到磁盘。而后再将这些key对应的value持久化到磁盘中，同时在内存中清除。这种特性使得Redis能够保持超过其机器自己内存大小的数据。固然，机器自己的内存必需要可以保持全部的key，毕竟这些数据是不会进行swap操做的。　　　　当从Redis中读取数据的时候，若是读取的key对应的value不在内存中，那么Redis就须要从swap文件中加载相应数据，而后再返回给请求方。这里就存在一个I/O线程池的问题。在默认的状况下，Redis会出现阻塞，即完成全部的swap文件加载后才会相应。这种策略在客户端的数量较小，进行批量操做的时候比较合适。可是若是将Redis应用在一个大型的网站应用程序中，这显然是没法知足大并发的状况的。因此Redis运行咱们设置I/O线程池的大小，对须要从swap文件中加载相应数据的读取请求进行并发操做，减小阻塞的时间。