MongoDB面试题__增强

时间 2019-11-07

原文原文链接

MongoDB是目前最好的面向文档的免费开源NoSQL数据库。若是你正准备参加MongoDB NoSQL数据库的技术面试，你最好看看下面的MongoDB NoSQL面试问答。这些MongoDB NoSQL面试问答涵盖了NoSQL数据库基本的概念，复制(Replication)，分片(Sharding)，事务和锁，跟踪分析工具(Profiler)，Nuances和日志等特性。让咱们看看下面的这些MongoDB NoSQL数据库的面试问答吧：
1. 你说的NoSQL数据库是什么意思？NoSQL与RDBMS直接有什么区别？为何要使用和不使用NoSQL数据库？说一说NoSQL数据库的几个优势？
我写了一篇完整的博客来回答这些问题，看这里
A) NoSQL: Not Only SQL 的缩写,它的意思是:使用关系型数据库的时候就用关系型数据库,不适用的时候也没有必要使用关系型数据库不能够,能够考虑使用更加适合的数据存储.
B) RDBMS:关系型数据库管理系统,它的特色是:
　　数据以表格的形式出现
　　每行为各类记录名称
　　每列为各类记录名称所对应的数据项
　　许多行和列组成一张表单
　　若个表组成一个database
NoSQL:非关系型数据库,它发展的缘由是互联网web2.0网站的兴起,特别是超大规模和高并发的SNS类型的纯动态网站已经显得力不从心,暴露出不少难以克服的问题才发展出来的,例如
　　对数据库高并发读写的需求
　　对数据库的高可扩展性和高可用性的需求
　　对海量数据的高校存储和访问的需求
NoSQL的特性:
　　能够处理超大量的数据
　　运行在便宜的PC服务器集群上
　　击碎了性能瓶颈------经过NoSQL架构能够省去将Web或Java应用和数据转换成SQL友好格式的时间,执行速度更快.
　　没有过多的操做
NoSQL的优势:
　　易扩展性---去掉了关系数据库的关系特性,数据之间无关系,很是容易扩展
　　大数据量,高性能-----NoSQL数据库都有很是高的读写能力,尤为在大数据量下,,一样表现优秀,这得益于他的无关系性,数据库的结构简单,通常MySQL使用Query Cache,每次表的跟新Cache就失效,是一种大粒度的Cache,在针对Web2.0的交互频繁的应用,Cache性能不高,而NoSQL的Cache是记录级的,是一种细粒度的Cache,因此NoSQL在这个层面上来讲急剧要性能高多了.
　　灵活的数据模型---NoSQL无需事先为要存储的数据创建字段,随时能够存储自定义的数据格式.
　　高可用性------NoSQL在不太影响性能的状况,就能够方便的实现高可用的架构,好比Cassandra,HBase模型,经过复制模型也能实现高可用性.
C) 关系行数据库的优点
　　保持数据的一致性(事务处理)
　　因为以标准做为前提,数据更新的开销很小(相同的字段基本都只有一处)
　　能够进行JOIN等复杂查询
　　存在不少实际成果和专业技术信息
D) NoSQL的应用场景:
　　但愿顺畅地对数据进行缓存(Cache)处理
　　但愿对数组类型的数据进行高速处理
　　但愿进行全保存web

NoSQL数据库有哪些类型？
NoSQL数据库有三种类型
　　键值存储
它的数据以键值的形式存储,虽然它的处理速度很是快,可是基本上只能经过键的彻底一致查询获取数据,根据数据的保存方式能够分为临时性,永久性和二者兼具三种.
临时性
Memcached
在内存中保存数据
能够进行很是快速的保存和读取处理
数据可能丢失
　　c) 永久性
　　在硬盘上保存数据
　　能够进行很是快的保存和读取处理(但没法和memcached相比)
　　数据不会丢失
　　d) 二者兼具
　　Redis
　　Redis首先把数据保存到内存中,在知足特定的条件的时候将数据写入到硬盘上,这样既确保了内存中数据的处理速度,又能够经过写入硬盘来保证数据的永久性,这种类型的数据库特别适合处理数组类型的数据.面试

　　面向文档的数据库
MongoDB, CouchDB
不定义表结构
可使用复杂的查询条件----面向文档的数据库能够经过复杂的查询条件来获取数据,虽然不具有事务处理和JOIN这些关系型数据库所具备的处理能力,但除此以外的其余处理基本上都能实现.
　　面向列的数据库
Cassandra, HBase
以列为单位来存储数据
对大量行少数列进行读取,对全部行的特定列进行同时更新
高扩展性(特别是写入速度)
应用十分困难
3. MySQL与MongoDB之间最基本的差异是什么？
MySQL和MongoDB二者都是免费开源的数据库。MySQL和MongoDB有许多基本差异包括数据的表示(data representation)，查询，关系，事务，schema的设计和定义，标准化(normalization)，速度和性能。经过比较MySQL和MongoDB，实际上咱们是在比较关系型和非关系型数据库。
NoSQL与关系型数据库设计理念比较
　　关系型数据库中的表都是存储一些格式化的数据结构,每一个元祖字段的组成都同样,即便不是每一个元祖都须要全部的字段,可是数据库会为每一个元祖分配全部的字段,这样的结构能够便于表与表之间进行链接等操做,但从另外一个角度来讲它也是关系型数据库性能瓶颈的一个因素,而非关系型数据库以键值对存储,它的结构不固定,每一个元祖能够有不同的字段,每个元祖能够根据须要增长一些本身的键值对,这样就不会局限于固定的结构,能够减小一些时间和空间的开销.数据库

4. 你怎么比较MongoDB、CouchDB及CouchBase?
MongoDB和CouchDB都是面向文档的数据库。MongoDB和CouchDB都是开源NoSQL数据库的最典型表明。除了都以文档形式存储外它们没有其余的共同点。MongoDB和CouchDB在数据模型实现、接口、对象存储以及复制方法等方面有不少不一样。
细节能够参见下面的连接：
MongDB vs CouchDBCouchDB vs CouchBase
5. MongoDB成为最好NoSQL数据库的缘由是什么?
如下特色使得MongoDB成为最好的NoSQL数据库：
面向文件的,丰富的数据模型
容易扩展
不牺牲速度
便捷的管理
丰富的查询语言数组

6.32位系统上有什么细微差异?
journaling会激活额外的内存映射文件。这将进一步抑制32位版本上的数据库大小。所以，如今journaling在32位系统上默认是禁用的。
7. journal回放在条目(entry)不完整时(好比恰巧有一个中途故障了)会遇到问题吗？
每一个journal (group)的写操做都是一致的，除非它是完整的不然在恢复过程当中它不会回放。
8. 分析器在MongoDB中的做用是什么?
MongoDB中包括了一个能够显示数据库中每一个操做性能特色的数据库分析器。经过这个分析器你能够找到比预期慢的查询（或写操做）；利用这一信息，好比，能够肯定是否须要添加索引。
9. 名字空间（namespace）是什么？
MongoDB存储BSON对象在丛集（collection）中。数据库名字和丛集名字以句点连结起来叫作名字空间（namespace）。
10. 若是用户移除对象的属性，该属性是否从存储层中删除？
是的，用户移除属性而后对象会从新保存（re-save()）。
11. 可否使用日志特征进行安全备份？
是的。
12. 容许空值null吗？
对于对象成员而言，是的。然而用户不可以添加空值（null）到数据库丛集（collection）由于空值不是对象。然而用户可以添加空对象{}。
13. 更新操做马上fsync到磁盘？
不会，磁盘写操做默认是延迟执行的。写操做可能在两三秒（默认在60秒内）后到达磁盘。例如，若是一秒内数据库收到一千个对一个对象递增的操做，仅刷新磁盘一次。（注意，尽管fsync选项在命令行和通过getLastError_old是有效的）（译者：也许是坑人的面试题？？）。
14. 如何执行事务/加锁？
MongoDB没有使用传统的锁或者复杂的带回滚的事务，由于它设计的宗旨是轻量，快速以及可预计的高性能。能够把它类比成MySQL MylSAM的自动提交模式。经过精简对事务的支持，性能获得了提高，特别是在一个可能会穿过多个服务器的系统里。
15. 为何个人数据文件如此庞大？
MongoDB会积极的预分配预留空间来防止文件系统碎片。
16. 启用备份故障恢复须要多久？
从备份数据库声明主数据库宕机到选出一个备份数据库做为新的主数据库将花费10到30秒时间。这期间在主数据库上的操做将会失败--包括写入和强一致性读取(strong consistent read)操做。然而，你还能在第二数据库上执行最终一致性查询(eventually consistent query)(在slaveOk模式下)，即便在这段时间里。
17. 什么是master或primary？
它是当前备份集群(replica set)中负责处理全部写入操做的主要节点/成员。在一个备份集群中，当失效备援(failover)事件发生时，一个另外的成员会变成primary。
18. 什么是secondary或slave？
Seconday从当前的primary上复制相应的操做。它是经过跟踪复制oplog(local.oplog.rs)作到的。
19. 我必须调用getLastError来确保写操做生效了么？
不用。无论你有没有调用getLastError(又叫"Safe Mode")服务器作的操做都同样。调用getLastError只是为了确认写操做成功提交了。固然，你常常想获得确认，可是写操做的安全性和是否生效不是由这个决定的。
20. Should I start out with sharded or with a non-sharded MongoDB environment? 我应该启动一个集群分片（sharded）仍是一个非集群分片的 MongoDB 环境？
为开发便捷起见，咱们建议以非集群分片（unsharded）方式开始一个 MongoDB 环境，除非一台服务器不足以存放你的初始数据集。从非集群分片升级到集群分片（sharding）是无缝的，因此在你的数据集还不是很大的时候不必考虑集群分片（sharding）。
21. 分片（sharding）和复制（replication）是怎样工做的？
每个分片（shard）是一个分区数据的逻辑集合。分片可能由单一服务器或者集群组成，咱们推荐为每个分片（shard）使用集群。
22. 数据在何时才会扩展到多个分片（shard）里？
MongoDB 分片是基于区域（range）的。因此一个集合（collection）中的全部的对象都被存放到一个块（chunk）中。只有当存在多余一个块的时候，才会有多个分片获取数据的选项（Only when there is more than 1 chunk is there an option for multiple shards to get data.）。如今，每一个默认块的大小是 64Mb，因此你须要至少 64 Mb 空间才能够实施一个迁移。
23. 当我试图更新一个正在被迁移的块（chunk）上的文档时会发生什么？
更新操做会当即发生在旧的分片（shard）上，而后更改才会在全部权转移（ownership transfers）前复制到新的分片上。
24. 若是在一个分片（shard）中止或者很慢的时候，我发起一个查询会怎样？
若是一个分片（shard）中止了，除非查询设置了“Partial”选项，不然查询会返回一个错误。若是一个分片（shard）响应很慢，MongoDB则会等待它的响应。
25. 我能够把moveChunk目录里的旧文件删除吗？
没问题，这些文件是在分片（shard）进行均衡操做（balancing）的时候产生的临时文件。一旦这些操做已经完成，相关的临时文件也应该被删除掉。但目前清理工做是须要手动的，因此请当心地考虑再释放这些文件的空间。
26. 我怎么查看 Mongo 正在使用的连接？
db._adminCommand("connPoolStats");
27. 若是块移动操做（moveChunk）失败了，我须要手动清除部分转移的文档吗？
不须要，移动操做是一致（consistent）而且是肯定性的（deterministic）；一次失败后，移动操做会不断重试；当完成后，数据只会出如今新的分片里（shard）。
28. 若是我在使用复制技术（replication），能够一部分使用日志（journaling）而其余部分则不使用吗？
能够。缓存