MongoDB概述

1、什么是MongoDB?

  • MongoDB是一个开源、高性能、无模式的文档型数据库;
  • 设计是用于简化开发和方便扩展;
  • NoSQL数据库;
  • 最像关系型数据库(MySQL)的非关系型数据库;
  • 它支持的数据结构Binary JSON:BSON,所以它既可以存储比较复杂的数据类型,又相当的灵活;
  • MongoDB中的记录是一个文档,它是一个由字段和值对(field:value)组成的数据结构;

 

2、MySQL和MongoDB对比

 

3、什么时候选择MongoDB?

  • 数据量大(mysql在数据量达到百万级后,效率开始骤降,所以大数据的要选择Nosql存储)
  • 写入操作频繁(读写都很频繁)
  • 价值较低的数据,对事务性要求不高

其他考虑方面:

  • 应用不需要事务及复杂 join 支持(数据价值较低,数据量极大)
  • 新应用,需求会变,数据模型无法确定,想快速迭代开发(数据模型不可确定时,首选Nosql)
  • 应用需要2000-3000以上的读写QPS(更高也可以)
  • 应用需要TB甚至 PB 级别数据存储
  • 应用发展迅速,需要能快速水平扩展
  • 应用要求存储的数据不丢失
  • 应用需要99.999%高可用
  • 应用需要大量的地理位置查询、文本查询

 

4、MongoDB的数据模型

  • MongoDB的最小存储单位就是文档(document)对象(关系型数据库的行);
  • 数据在MongoDB中以BSON(Binary-JSON)文档的格式存储在磁盘上;

关于BSON的扩展:

  • BSON(Binary Serialized Document Format)是一种类json的一种二进制形式的存储格式,简称Binary JSON。BSON和JSON一样,支持内嵌的文档对象和数组对象,但是BSON有JSON没有的一些数据类型,如Date和BinData类型。
  • BSON采用了类似于 C 语言结构体的名称、对表示方法,支持内嵌的文档对象和数组对象,具有轻量性、可遍历性、高效性的三个特点,可以有效描述非结构化数据和结构化数据。这种格式的优点是灵活性高,但它的缺点是空间利用率不是很理想。
  • Bson中,除了基本的JSON类型:string,integer,boolean,double,null,array和object,mongo还使用了特殊的数据类型。这些类型包括date,object id,binary data,regular expression 和code。每一个驱动都以特定语言的方式实现了这些类型,查看你的驱动的文档来获取详细信息。

 

5、MongoDB的特点

(1)高性能:

  • MongoDB提供高性能的数据持久性。特别是对嵌入式数据模型的支持减少了数据库系统上的I/O活动。
  • 索引支持更快的查询,并且可以包含来自嵌入式文档和数组的键。(文本索引解决搜索的需求、TTL索引解决历史数据自动过期的需求、地理位置索引可用于构建各种 O2O 应用)mmapv1、wiredtiger、mongorocks(rocksdb)、in-memory 等多引擎支持满足各种场景需求。
  • Gridfs解决文件存储的需求。

(2)高可用性:

  • MongoDB的复制工具称为副本集(replica set),它可提供自动故障转移和数据冗余。

(3)高扩展性:

  • MongoDB提供了水平可扩展性作为其核心功能的一部分。
  • 分片将数据分布在一组集群的机器上。(海量数据存储,服务能力水平扩展)。
  • 从3.4开始,MongoDB支持基于片键创建数据区域。在一个平衡的集群中,MongoDB将一个区域所覆盖的读写只定向到该区域内的那些片。

(4)丰富的查询支持:

  • MongoDB支持丰富的查询语言,支持读和写操作(CRUD),比如数据聚合、文本搜索和地理空间查询等。

(5)其他特点:如无模式(动态模式)、灵活的文档模型。