了解 MongoDB 看这一篇就够了

时间 2019-11-06

标签了解 mongodb 看这一篇够了栏目 MongoDB 繁體版

原文原文链接

目录html

1、简介

MongoDB 是一款流行的开源文档型数据库，从它的命名来看，确实是有必定野心的。
MongoDB 的原名一开始来自于英文单词"Humongous", 中文含义是指"庞大"，即命名者的意图是能够处理大规模的数据。mysql

但笔者更喜欢称呼它为 "芒果"数据库，除了译音更加相近以外，缘由还来自于这几年使用 MongoDB 的两层感受：算法

第一层感觉是"爽"，使用这个文档数据库的特色是几乎不受什么限制，一方面Json文档式的结构更容易理解，而无Schema约束也让DDL管理更加简单，一切均可以很快速的进行。sql
第二层感觉是"酸爽"，这点相信干运维或是支撑性工做的兄弟感觉会比较深入，MongoDB 因为入门体验"太过于友好"，致使一些团队认为用好这个数据库是个很简单的事情，因此开发兄弟在存量系统上埋一些坑也是正常的事情。
所谓交付一时爽，维护火葬场.. 固然了，这句话可能有些过。但这里的潜台词是：与传统的RDBMS数据库同样，MongoDB 在使用上也须要认真的考量和看护，否则的化，会遇到更多的坑。mongodb

那么，尽管文档数据库在选型上会让一些团队望而却步，仍然不阻碍该数据库所得到的一些支持，好比 DB-Engine 上的排名：数据库

图-DBEngine排名json

在所有的排名中，MongoDB 长期排在第5位(文档数据库排名第1位)，同时也是最受欢迎的 NoSQL 数据库。
另外，MongoDB 的社区一直比较活跃，加上商业上的驱动(MongoDB于2017年在纳斯达克上市)，这些因素都推进了该开源数据库的发展。数组

若是对于 MongoDB的发展史感兴趣，能够参考下没有一个技术天生完美，MongoDB 十年发展全纪录这篇文章。服务器

MongoDB 数据库的一些特性：网络

面向文档存储，基于JSON/BSON 可表示灵活的数据结构
动态 DDL能力，没有强Schema约束，支持快速迭代
高性能计算，提供基于内存的快速数据查询
容易扩展，利用数据分片能够支持海量数据存储
丰富的功能集，支持二级索引、强大的聚合管道功能，为开发者量身定作的功能，如数据自动老化、固定集合等等。
跨平台版本、支持多语言SDK..

假定你是初次了解 MongoDB，下面的内容将能帮助你对该数据库技术的全貌产生必定的了解。

2、基本模型

数据结构对于一个软件来讲是相当重要的，MongoDB 在概念模型上参考了 SQL数据库，但并不是彻底相同。

关于这点，也有人说，MongoDB 是 NoSQL中最像SQL的数据库..

以下表所示：

SQL概念	MongoDB概念
database	database
table	collection
row	document
column	field

database 数据库，与SQL的数据库(database)概念相同，一个数据库包含多个集合(表)
collection 集合，至关于SQL中的表(table)，一个集合能够存放多个文档(行)。不一样之处就在于集合的结构(schema)是动态的，不须要预先声明一个严格的表结构。更重要的是，默认状况下 MongoDB 并不会对写入的数据作任何schema的校验。
document 文档，至关于SQL中的行(row)，一个文档由多个字段(列)组成，并采用bson(json)格式表示。
field 字段，至关于SQL中的列(column)，相比普通column的差异在于field的类型能够更加灵活，好比支持嵌套的文档、数组。
此外，MongoDB中字段的类型是固定的、区分大小写、而且文档中的字段也是有序的。

另外，SQL 还有一些其余的概念，对应关系以下：

SQL概念	MongoDB概念
primary key	_id
foreign key	reference
view	view
index	index
join	$lookup
transaction	trasaction
group by	aggregation

_id 主键，MongoDB 默认使用一个_id 字段来保证文档的惟一性。
reference 引用，勉强能够对应于外键(foreign key) 的概念，之因此是勉强是由于 reference 并无实现任何外键的约束，而只是由客户端(driver)自动进行关联查询、转换的一个特殊类型。
view 视图，MongoDB 3.4 开始支持视图，和 SQL 的视图没有什么差别，视图是基于表/集合之上进行动态查询的一层对象，能够是虚拟的，也能够是物理的(物化视图)。
index 索引，与SQL 的索引相同。
$lookup，这是一个聚合操做符，能够用于实现相似 SQL-join 链接的功能
transaction 事务，从 MongoDB 4.0 版本开始，提供了对于事务的支持
aggregation 聚合，MongoDB 提供了强大的聚合计算框架，group by 是其中的一类聚合操做。

BSON 数据类型

MongoDB 文档可使用 Javascript 对象表示，从格式上讲，是基于 JSON 的。

一个典型的文档以下：

{
  "_id": 1,
  "name" : { "first" : "John", "last" : "Backus" },
  "contribs" : [ "Fortran", "ALGOL", "Backus-Naur Form", "FP" ],
  "awards" : [
    {
      "award" : "W.W. McDowell Award",
      "year" : 1967,
      "by" : "IEEE Computer Society"
    }, {
      "award" : "Draper Prize",
      "year" : 1993,
      "by" : "National Academy of Engineering"
    }
  ]
}

曾经，JSON 的出现及流行让 Web 2.0 的数据传输变得很是简单，因此使用 JSON 语法是很是容易让开发者接受的。
可是 JSON 也有本身的短板，好比没法支持像日期这样的特定数据类型，所以 MongoDB 实际上使用的是一种扩展式的JSON，叫 BSON(Binary JSON)。

BSON 所支持的数据类型包括：

图-BSON类型

分布式ID

在单机时代，大多数应用可使用数据库自增式ID 来做为主键。传统的 RDBMS 也都支持这种方式，好比 mysql 能够经过声明 auto_increment来实现自增的主键。但一旦数据实现了分布式存储，这种方式就再也不适用了，缘由就在于没法保证多个节点上的主键不出现重复。

为了实现分布式数据ID的惟一性保证，应用开发者提出了本身的方案，而大多数方案中都会将ID分段生成，如著名的 snowflake 算法中就同时使用了时间戳、机器号、进程号以及随机数来保证惟一性。

MongoDB 采用 ObjectId 来表示主键的类型，数据库中每一个文档都拥有一个_id 字段表示主键。
_id 的生成规则以下：

图-ObjecteID

其中包括：

4-byte Unix 时间戳
3-byte 机器 ID
2-byte 进程 ID
3-byte 计数器(初始化随机)

值得一提的是 _id 的生成实质上是由客户端(Driver)生成的，这样能够得到更好的随机性，同时下降服务端的负载。
固然服务端也会检测写入的文档是否包含_id 字段，若是没有就生成一个。

3、操做语法

除了文档模型自己，对于数据的操做命令也是基于JSON/BSON 格式的语法。

好比插入文档的操做：

db.book.insert(
{
  title: "My first blog post",
  published: new Date(),
  tags: [ "NoSQL", "MongoDB" ],
  type: "Work",
  author : "James",
  viewCount: 25,
  commentCount: 2
}
)

执行文档查找：

db.book.find({author : "James"})

更新文档的命令：

db.book.update(
   {"_id" : ObjectId("5c61301c15338f68639e6802")},
   {"$inc": {"viewCount": 3} }
)

删除文档的命令：

db.book.remove({"_id":
     ObjectId("5c612b2f15338f68639e67d5")})

在传统的SQL语法中，能够限定返回的字段，MongoDB可使用Projection来表示：

db.book.find({"author": "James"}, 
    {"_id": 1, "title": 1, "author": 1})

实现简单的分页查询：

db.book.find({})
    .sort({"viewCount" : -1})
    .skip(10).limit(5)

这种基于BSON/JSON 的语法格式并不复杂，它的表达能力或许要比SQL更增强大。
与 MongoDB 作法相似的还有 ElasticSearch，后者是搜索数据库的佼佼者。

关于文档操做与 SQL方式完整的对比，官方的文档描述得比较详细：
https://docs.mongodb.com/manual/reference/sql-comparison/

那么，一个有趣的问题是 MongoDB 能不能用 SQL进行查询？

固然是能够！

但须要注意这些功能并非 MongoDB 原生自带的，而须要借由第三方工具平台实现：

客户端使用SQL，可使用 mongobooster、studio3t 这样的工具
服务端的话，能够看看 presto 之类的一些平台..

4、索引

无疑，索引是一个数据库的关键能力，MongoDB 支持很是丰富的索引类型。
利用这些索引，能够实现快速的数据查找，而索引的类型和特性则是针对不一样的应用场景设计的。

索引的技术实现依赖于底层的存储引擎，在当前的版本中 MongoDB 使用 wiredTiger 做为默认的引擎。
在索引的实现上使用了 B+树的结构，这与其余的传统数据库并无什么不一样。
因此这是个好消息，大部分基于SQL数据库的一些索引调优技巧在 MongoDB 上仍然是可行的。

图-B+树

使用 ensureIndexes 能够为集合声明一个普通的索引：

db.book.ensureIndex({author: 1})

author后面的数字 1 表明升序，若是是降序则是 -1

实现复合式(compound)的索引，以下：

db.book.ensureIndex({type: 1, published: 1})

只有对于复合式索引时，索引键的顺序才变得有意义

若是索引的字段是数组类型，该索引就自动成为数组(multikey)索引：

db.book.ensureIndex({tags: 1})

MongoDB 能够在复合索引上包含数组的字段，但最多只能包含一个

索引特性

在声明索引时，还能够经过一些参数化选项来为索引赋予必定的特性，包括：

unique=true，表示一个惟一性索引
expireAfterSeconds=3600，表示这是一个TTL索引，而且数据将在1小时后老化
sparse=true，表示稀疏的索引，仅索引非空(non-null)字段的文档
partialFilterExpression: { rating: { $gt: 5 }，条件式索引，即知足计算条件的文档才进行索引

索引分类

除了普通索引以外，MongoDB 支持的类型还包括：

哈希(HASH)索引，哈希是另外一种快速检索的数据结构，MongoDB 的 HASH 类型分片键会使用哈希索引。
地理空间索引，用于支持快速的地理空间查询，如寻找附近1千米的商家。
文本索引，用于支持快速的全文检索
模糊索引(Wildcard Index)，一种基于匹配规则的灵活式索引，在4.2版本开始引入。

索引评估、调优

使用 explain() 命令能够用于查询计划分析，进一步评估索引的效果。
以下：

> db.test.explain().find( { a : 5 } )

{
  "queryPlanner" : {
    ...
    "winningPlan" : {
      "stage" : "FETCH",
      "inputStage" : {
        "stage" : "IXSCAN",
        "keyPattern" : {
            "a" : 5
        },
        "indexName" : "a_1",
        "isMultiKey" : false,
        "direction" : "forward",
        "indexBounds" : {"a" : ["[5.0, 5.0]"]}
        }
    }},
   ...
}

从结果 winningPlan 中能够看出执行计划是否高效，好比：

未能命中索引的结果，会显示COLLSCAN
命中索引的结果，使用IXSCAN
出现了内存排序，显示为 SORT

关于 explain 的结果说明，能够进一步参考文档：

https://docs.mongodb.com/manual/reference/explain-results/index.html

5、集群

在大数据领域经常提到的4V特征中，Volume(数据量大)是首当其冲被说起的。
因为单机垂直扩展能力的局限，水平扩展的方式则显得更加的靠谱。 MongoDB 自带了这种能力，能够将数据存储到多个机器上以提供更大的容量和负载能力。
此外，同时为了保证数据的高可用，MongoDB 采用副本集的方式来实现数据复制。

一个典型的MongoDB集群架构会同时采用分片+副本集的方式，以下图：

图-MongoDB 分片集群(Shard Cluster)

架构说明

数据分片（Shards）
分片用于存储真正的集群数据，能够是一个单独的 Mongod实例，也能够是一个副本集。生产环境下Shard通常是一个 Replica Set，以防止该数据片的单点故障。
对于分片集合(sharded collection)来讲，每一个分片上都存储了集合的一部分数据(按照分片键切分)，若是集合没有分片，那么该集合的数据都存储在数据库的 Primary Shard中。
配置服务器（Config Servers）
保存集群的元数据（metadata），包含各个Shard的路由规则，配置服务器由一个副本集(ReplicaSet)组成。
查询路由（Query Routers）
Mongos是 Sharded Cluster 的访问入口，其自己并不持久化数据。Mongos启动后，会从 Config Server 加载元数据，开始提供服务，并将用户的请求正确路由到对应的Shard。
Sharding 集群能够部署多个 Mongos 以分担客户端请求的压力。

分片机制

下面的几个细节，对于理解和应用 MongoDB 的分片机制比较重要，因此有必要说起一下：

1. 数据如何切分

首先，基于分片切分后的数据块称为 chunk，一个分片后的集合会包含多个 chunk，每一个 chunk 位于哪一个分片(Shard) 则记录在 Config Server(配置服务器)上。
Mongos 在操做分片集合时，会自动根据分片键找到对应的 chunk，并向该 chunk 所在的分片发起操做请求。

数据是根据分片策略来进行切分的，而分片策略则由分片键(ShardKey)+分片算法(ShardStrategy)组成。

MongoDB 支持两种分片算法：

范围分片

如上图所示，假设集合根据x字段来分片，x的取值范围为[minKey, maxKey]（x为整型，这里的minKey、maxKey为整型的最小值和最大值），将整个取值范围划分为多个chunk，每一个chunk（默认配置为64MB）包含其中一小段的数据：
如Chunk1包含x的取值在[minKey, -75)的全部文档，而Chunk2包含x取值在[-75, 25)之间的全部文档...

范围分片能很好的知足范围查询的需求，好比想查询x的值在[-30, 10]之间的全部文档，这时 Mongos 直接能将请求路由到 Chunk2，就能查询出全部符合条件的文档。范围分片的缺点在于，若是 ShardKey 有明显递增（或者递减）趋势，则新插入的文档多会分布到同一个chunk，没法扩展写的能力，好比使用_id做为 ShardKey，而MongoDB自动生成的id高位是时间戳，是持续递增的。

哈希分片

Hash分片是根据用户的 ShardKey 先计算出hash值（64bit整型），再根据hash值按照范围分片的策略将文档分布到不一样的 chunk。
因为 hash值的计算是随机的，所以 Hash 分片具备很好的离散性，能够将数据随机分发到不一样的 chunk 上。 Hash 分片能够充分的扩展写能力，弥补了范围分片的不足，但不能高效的服务范围查询，全部的范围查询要查询多个 chunk 才能找出知足条件的文档。

2. 如何保证均衡

如前面的说明中，数据是分布在不一样的 chunk上的，而 chunk 则会分配到不一样的分片上，那么如何保证分片上的数据(chunk) 是均衡的呢？
在真实的场景中，会存在下面两种状况：

A. 全预分配，chunk 的数量和 shard 都是预先定义好的，好比 10个shard，存储1000个chunk，那么每一个shard 分别拥有100个chunk。
此时集群已是均衡的状态(这里假定)
B. 非预分配，这种状况则比较复杂，通常当一个 chunk 太大时会产生分裂(split)，不断分裂的结果会致使不均衡；或者动态扩容增长分片时，也会出现不均衡的状态。这种不均衡的状态由集群均衡器进行检测，一旦发现了不均衡则执行 chunk数据的搬迁达到均衡。

MongoDB 的数据均衡器运行于 Primary Config Server(配置服务器的主节点)上，而该节点也同时会控制 Chunk 数据的搬迁流程。

图-数据自动均衡

对于数据的不均衡是根据两个分片上的 Chunk 个数差别来断定的，阈值对应表以下：

Number of Chunks	Migration Threshold
Fewer than 20	2
20-79	4
80 and greater	8

MongoDB 的数据迁移对集群性能存在必定影响，这点没法避免，目前的规避手段只能是将均衡窗口对齐到业务闲时段。

3. 应用高可用

应用节点能够经过同时链接多个 Mongos 来实现高可用，以下：

图- mongos 高可用

固然，链接高可用的功能是由 Driver 实现的。

副本集

副本集又是另外一个话题，实质上除了前面架构图所体现的，副本集能够做为 Shard Cluster 中的一个Shard(片)以外，对于规模较小的业务来讲，也可使用一个单副本集的方式进行部署。
MongoDB 的副本集采起了一主多从的结构，即一个Primary Node + N* Secondary Node的方式，数据从主节点写入，并复制到多个备节点。

典型的架构以下：

利用副本集，咱们能够实现：：

数据库高可用，主节点宕机后，由备节点自动选举成为新的主节点；
读写分离，读请求能够分流到备节点，减轻主节点的单点压力。

请注意，读写分离只能增长集群"读"的能力，对于写负载很是高的状况却无能为力。
对此需求，使用分片集群并增长分片，或者提高数据库节点的磁盘IO、CPU能力能够取得必定效果。

选举

MongoDB 副本集经过 Raft 算法来完成主节点的选举，这个环节在初始化的时候会自动完成，以下面的命令：

config = {
    _id : "my_replica_set",
    members : [
        {_id : 0, host : "rs1.example.net:27017"},
        {_id : 1, host : "rs2.example.net:27017"},
        {_id : 2, host : "rs3.example.net:27017"},
  ]
}
rs.initiate(config)

initiate 命令用于实现副本集的初始化，在选举完成后，经过 isMaster()命令就能够看到选举的结果：

> db.isMaster()

{
    "hosts" : [
    "192.168.100.1:27030",
    "192.168.100.2:27030",
    "192.168.100.3:27030"
    ],
    "setName" : "myReplSet",
    "setVersion" : 1,
    "ismaster" : true,
    "secondary" : false,
    "primary" : "192.168.100.1:27030",
    "me" : "192.168.100.1:27030",
    "electionId" : ObjectId("7fffffff0000000000000001"),
    "ok" : 1
}

受 Raft算法的影响，主节点的选举须要知足"大多数"原则，能够参考下表：

投票成员数	大多数
1	1
2	2
3	2
4	3
5	3

所以，为了不出现平票的状况，副本集的部署通常采用是基数个节点，好比3个，正所谓三人行必有我师..

心跳

在高可用的实现机制中，心跳(heartbeat)是很是关键的，判断一个节点是否宕机就取决于这个节点的心跳是否仍是正常的。
副本集中的每一个节点上都会定时向其余节点发送心跳，以此来感知其余节点的变化，好比是否失效、或者角色发生了变化。
利用心跳，MongoDB 副本集实现了自动故障转移的功能，以下图：

默认状况下，节点会每2秒向其余节点发出心跳，这其中包括了主节点。若是备节点在10秒内没有收到主节点的响应就会主动发起选举。
此时新一轮选举开始，新的主节点会产生并接管原来主节点的业务。整个过程对于上层是透明的，应用并不须要感知，由于 Mongos 会自动发现这些变化。
若是应用仅仅使用了单个副本集，那么就会由 Driver 层来自动完成处理。

复制

主节点和备节点的数据是经过日志(oplog)复制来实现的，这很相似于 mysql 的 binlog。
在每个副本集的节点中，都会存在一个名为local.oplog.rs的特殊集合。当 Primary 上的写操做完成后，会向该集合中写入一条oplog，
而 Secondary 则持续从 Primary 拉取新的 oplog 并在本地进行回放以达到同步的目的。

下面，看看一条 oplog 的具体形式：

{
"ts" : Timestamp(1446011584, 2),
"h" : NumberLong("1687359108795812092"),
"v" : 2,
"op" : "i",
"ns" : "test.nosql",
"o" : { "_id" : ObjectId("563062c0b085733f34ab4129"), "name" : "mongodb", "score" : "100" }
}

其中的一些关键字段有：

ts 操做的 optime，该字段不只仅包含了操做的时间戳(timestamp)，还包含一个自增的计数器值。
h 操做的全局惟一表示
v oplog 的版本信息
op 操做类型，好比 i=insert,u=update..
ns 操做集合，形式为 database.collection
o 指具体的操做内容，对于一个 insert 操做，则包含了整个文档的内容

MongoDB 对于 oplog 的设计是比较仔细的，好比：

oplog 必须保证有序，经过 optime 来保证。
oplog 必须包含可以进行数据回放的完整信息。
oplog 必须是幂等的，即屡次回放同一条日志产生的结果相同。
oplog 集合是固定大小的，为了不对空间占用太大，旧的 oplog 记录会被滚动式的清理。

有兴趣的读者，能够参考官方文档：

https://docs.mongodb.com/manual/core/replica-set-oplog/index.html

6、事务与一致性

一直以来，"不支持事务" 是 MongoDB 一直被诟病的问题，固然也能够说这是 NoSQL 数据库的一种权衡(放弃事务，追求高性能、高可扩展)
但实质上，MongoDB 很早就有事务的概念，可是这个事务只能是针对单文档的，即单个文档的操做是有原子性保证的。
在4.0 版本以后，MongoDB 开始支持多文档的事务：

4.0 版本支持副本集范围的多文档事务。
4.2 版本支持跨分片的多文档事务(基于两阶段提交)。

在事务的隔离性上，MongoDB 支持快照(snapshot)的隔离级别，能够避免脏读、不可重复读和幻读。
尽管有了真正意义上的事务功能，但多文档事务对于性能有必定的影响，应用应该在充分评估后再作选用。

一致性

一致性是一个复杂的话题，而一致性更多从应用角度上提出的，好比：

向系统写入一条数据，应该可以立刻读到写入的这个数据。

在分布式架构的CAP理论以及许多延续的观点中提到，因为网络分区的存在，要求系统在一致性和可用性之间作出选择，而不能二者兼得。

图 -CAP理论

在 MongoDB 中，这个选择是能够由开发者来定的。 MongoDB 容许客户端为其操做设定必定的级别或者偏好，包括：

read preference
读取偏好，可指定读主节点、读备节点，或者是优先读主、优先读备、取最近的节点
write concern
写关注，指定写入结果达到什么状态时才返回，能够为无应答(none)、应答(ack)，或者是大多数节点完成了数据复制等等
read concern
读关注，指定读取的数据版本处于怎样的状态，能够为读本地、读大多数节点写入，或者是线性读(linearizable)等等。

使用不一样的设定将会产生对于C(一致性)、A(可用性)的不一样的抉择，好比：

将读偏好设置为 primary，此时读写都在主节点上。这保证了数据的一致性，但一旦主节点宕机会致使失败(可用性下降)
将读偏好设置为 secondaryPrefered，此时写主，优先读备，可用性提升了，但数据存在延迟(出现不一致)
将读写关注都设置为 majority(大多数)，一致性提高了，但可用性也同时下降了(节点失效会致使大多数写失败)

关于这种权衡的讨论会一直存在，而 MongoDB 除了提供多样化的选择以外，其主要是经过复制、基于心跳的自动failover等机制来下降系统发生故障时产生的影响，从而提高总体的可用性。

小结

本文主要揭示了 MongoDB 多个方面的细节，同时在使用体验上也借助 SQL 的概念作了一些对比。
从笔者的角度看，MongoDB 的发展性是很强的，其灵活快速的开发模式、天生自带分布式等能力弥补了传统型SQL数据库的缺陷。固然，目前的 NewSQL 本质上也貌似在以"模仿的方式"弥补这些缺陷。

但愿本文的内容对你能有些参考。