MongoDB快速入门

1、NoSQL概述

NoSQL是Not Only SQL的缩写,指的是非关系型数据库,与传统的关系型数据库相对应,主要用于超大规模数据的存储。前端

与RDBMS相比,具备以下特色:正则表达式

  • 没有声明性查询语言
  • 没有预约义模式
  • 键值对存储
  • 最终一致性
  • 非结构化和不可预知的数据
  • CAP定理
  • 高性能和可伸缩性

优势:高可扩展性;分布式计算;低成本;半结构化数据;关系简单。sql

缺点:没有标准化;查询功能有限;最终一致性没有ACID直观。mongodb

2、MongoDB概述

MongoDB是一个基于分布式文件存储的开源数据库系统,为Web应用提供可扩展的高性能数据存储解决方案。将数据存储为一个文档,数据结构由键值对组成。存储的数据与应用的数据,在格式上(JSON)高度一致。数据库

主要特色:express

  • 面向文档存储,操做简单
  • 能够设置任何属性的索引
  • 支持丰富的查询表达式
  • 容许在服务端执行脚本
  • 支持各类编程语言
  • 具备更高的扩展性
  • 能够将负载分布在各个节点

官网地址编程

3、主要概念

一、数据库database

与RDBMS的概念相同。MongoDB的默认数据库为“db”,存储在data目录中。不一样的数据库放置在不一样的文件中。json

数据库名称的限制:数组

  • 不能是空字符串
  • 不能包含空格、“.”、“/”、“”、“$”、空字符等
  • 应该所有小写
  • 最长64个字节

保留的数据库名称:服务器

  • admin,至关于一个root数据库,若是将用户添加到该数据库,那么该用户将自动得到全部数据库的权限
  • local,这个数据库不会被复制,能够用来存储仅限于本地单个服务器的任意集合
  • config,当Mongo用于分片设置时,该数据库在内部使用,用来保存分片的相关信息

二、集合collection

至关于RDBMS中“表”的概念。集合没有固定的结构,能够插入不一样格式和类型的数据。数据库的信息存储在dbname.system命名空间下的特殊集合中。

集合名称的限制:

  • 不能是空字符串
  • 不能包含空字符,空字符表示集合名的结尾
  • 不能以system开头,属于系统保留的前缀
  • 不能包含保留字符

三、文档document

至关于RDBMS中“行”的概念。MongoDB的文档不须要设置相同的字段,而且相同字段不须要相同的数据类型。文档的数据结构采用BSON格式,和JSON基本相同,BSON是一种类json的二进制形式的存储格式。

使用文档时须要注意:

  • 文档中的键值对是有序的
  • 文档中的值能够是任意数据类型
  • 区分类型和大小写
  • 不能有重复的键
  • 文档的键是字符串

四、字段field

至关于RDBMS中“列”的概念。

字段的经常使用类型:

  • String,字符串类型,在MongoDB中,UTF-8才是合法编码
  • Integer,整形数值
  • Boolean,布尔值
  • Double,双精度浮点值
  • Min/Max keys,将一个值与BSON(二进制的JSON)元素的最低值/最高值相比较
  • Arrays,将数组或列表或多个值存储为一个键
  • Timestamp,时间戳,记录文档修改或添加的具体时间
  • Object,用于内嵌文档
  • Null,用于建立空值
  • Symbol,符号,基本等同于字符串类型
  • Date,日期时间
  • Object ID,用于建立文档的ID
  • Binary Data,用于存储二进制数据
  • Code,代码类型,用于在文档中存储JavaScript代码
  • Regular expression,正则表达式类型,用于存储正则表达式

五、索引index

与RDBMS的概念相同。

六、主键primary key

自动将_id字段设置为主键。

七、表链接

不支持表链接,但能够经过嵌入文档的方式实现。

4、用法

一、安装

从官网下载并直接安装,设置path环境变量。

二、启动

直接启动:

mongod

指定配置文件启动:

mongod --config /etc/mongodb.conf

三、操做数据库

建立数据库:

use DATABASE_NAME

若是数据库不存在,则建立数据库,不然切换到指定的数据库。

查看当前数据库:

db

查看全部数据库:

show dbs

删除当前数据库:

db.dropDatabase()

在删除以前应该使用db命令查看当前数据库名,或者使用use命令切换到要删除的数据库。

删除集合:

db.collection.drop()

四、操做文档

插入:

db.COLLECTION_NAME.insert(document)

若是集合不存在,MongoDB会自动建立该集合并插入文档。若是不指定_id字段,save方法与insert方法相似。若是指定_id字段,save方法会更新该_id的数据。

更新:

db.COLLECTION_NAME.update(query, update, {upsert:boolean, multi:boolean, writeConcern:document})
  • query,更新的查询条件,相对于sql的where语句
  • update,更新的对象和操做符,相对于sql的set语句
  • upsert,可选,若是要更新的记录不存在,是否插入新记录,true为插入,默认false为不插入
  • multi,可选,默认false为只更新第一条记录,若是为true,则所有更新
  • writeConcern,可选,表示抛出异常的级别

经过传入的文档替换已有的文档:

db.COLLECTION_NAME.save(document, {writeConcern:document})

删除:

db.COLLECTION_NAME.remove(query, {justOne:boolean, writeConcern:document})
  • query,可选,要删除的文档的知足条件
  • justOne,可选,若是为true,则只删除一个文档
  • writeConcern,可选,表示抛出异常的级别

若是不包含任何参数,则删除集合中的全部文档。建议在执行remove操做以前,先执行find命令来判断执行条件是否正确。

查询:

db.COLLECTION_NAME.find()

若是但愿格式化查询的结果,可使用pretty方法:

db.COLLECTION_NAME.find().pretty()

若是但愿只返回一个文档:

db.COLLECTION_NAME.findOne()

在find方法中,传入多个键值对,每一个键值对之间以逗号分隔,等价于SQL中的and条件:

db.COLLECTION_NAME.find({key1:value1, key2:value2})

在find方法中,使用关键字$or,等价于SQL中的or条件:

db.COLLECTION_NAME.find({$or:[{key1:value1, key2:value2}]})

在MongoDB中,有四种条件操做符,分别是$gt、$lt、$gte、$lte,对应SQL中的大于、小于、大于等于和小于等于。

db.COLLECTION_NAME.find({key: {$gt : value}})

还有一个条件操做符$type,用来判断字段的类型:

db.COLLECTION_NAME.find({key: {$type : typeid}})

使用limit方法,指定要读取的记录数量:

db.COLLECTION_NAME.find().limit(NUMBER)

使用skip方法,跳过指定数量的记录,参数默认为0:

db.COLLECTION_NAME.find().limit(NUMBER).skip(NUMBER)

使用sort方法,指定排序的字段,参数为1表示升序,-1表示降序,默认按照升序排列:

db.COLLECTION_NAME.find().sort({KEY:1})

使用aggregate方法,处理数据并返回计算后的数据结果:

db.COLLECTION_NAME.aggregate(AGGREGATE_OPERATION)

聚合操做包括:

  • $sum,计算求和
  • $avg,计算平均值
  • $min,获取最小值
  • $max,获取最大值
  • $push,插入值到一个数组中
  • $addToSet,插入值到一个数组中,但不建立副本
  • $first,根据排序获取第一个文档数据
  • $last,根据排序获取最后一个文档数据

在MongoDB中,可使用聚合管道,将文档在一个管道处理完毕以后把结果传递给下一个管道处理。

经常使用的管道操做:

  • $project,修改输入文档的结构,能够用来重命名、增长或删除字段,也能够用来建立计算结果以及嵌套文档
  • $match,用于过滤数据,只输出符合条件的文档
  • $limit,用来限制聚合管道返回的文档数
  • $skip,在聚合管道中跳过指定数量的文档
  • $unwind,将文档中的某一个数组类型字段拆分红多条,每条包含数组中的一个值
  • $group,将集合中的文档分组,用于统计结果
  • $sort,将输入文档进行排序以后输出
  • $geoNear,输出接近某一地理位置的有序文档

索引是特殊的数据结构,存储在一个易于遍历读取的数据集合中,是对数据库表中的若干字段的值进行排序的一种结构。MongoDB还提供多个可选参数,用来限定索引的规则。

建立索引:

db.COLLECTION_NAME.ensureIndex({KEY:1})

五、数据库的备份和恢复

复制:将数据同步在多个服务器的过程。提供了数据的冗余备份,并在多个服务器上存储数据副本。容许从硬件故障和服务中断中恢复数据。复制至少须要两个节点,其中一个是主节点,负责处理客户端请求,其他都是从节点,负责复制主节点的数据。

分片:当存储海量数据时,一台机器不足以存储数据,也不足以提供可接受的读写量。能够经过在多台机器上分割数据,使得数据库系统可以存储和处理更多的数据。Shard用于存储实际的数据块,实际使用中一个shard server能够由几台机器组成。Config server存储整个ClusterMetadata,其中包括chunk信息。Query routers前端路由,客户端由此接入。

备份:在MongoDB中,可使用mongodump命令来备份数据,该命令能够导出全部数据到指定目录。

mongodump -h dbhost -d dbname -o dbdirectory

恢复:在MongoDB中,可使用mongorestore命令来恢复备份的数据。

mongorestore -h dbhost -d dbname --directoryperdb dbdirectory

六、数据库的监控

在安装部署并启动MongoDB服务后,必须了解运行状况,并查看其性能。

mongostat是MongoDB自带的状态检测工具。mongotop用来跟踪一个MongoDB实例,查看读写所花费的时间。这两个工具都位于MongoDB的安装目录的bin目录下。

相关文章
相关标签/搜索