[转载]MongoDB学习(二):数据类型和基本概念

数据类型

基本数据类型

  MongoDB的文件存储格式为BSON,同JSON同样支持往其它文档对象和数组中再插入文档对象和数组,同时扩展了JSON的数据类型.与数据库打交道的那些应用。例如,JSON没有日期类型,这会使得处理原本简单的日期问题变得很是繁琐。只有一种数字类型,无法区分浮点数和整数,更不能区分32位和64位数字。也没有办法表示其余经常使用类型,如正则表达式或函数。html

  下面是MongoDB的支持的数据类型:web

  • null    null用于表示空值或者不存在的字段。 {"x":null}
  • 布尔   布尔类型有两个值'true'和'false1'. {"X":true}
  • 32位整数  类型不可用。JavaScript仅支持64位浮点数,因此32位整数会被自动转换。
  • 64位整数  不支持这个类型。shell会使用一个特殊的内嵌文档来显示64位整数,
  • 64位浮点数  shell中的数字都是这种类型。下面的表示都是浮点数: {"X" : 3.1415926} {"X" : 3}
  • 字符串   UTF-8字符串均可表示为字符串类型的数据: {"x" : "foobar"}
  • 符号  不支持这种类型。shell将数据库里的符号类型转换成字符串。
  • 对象id  对象id是文档的12字节的惟一 ID, {"X" :ObjectId() }
  • 日期  日期类型存储的是从标准纪元开始的毫秒数。不存储时区: {"X" : new Date()}
  • 正则表达式  文档中能够包含正则表达式,采用JavaScript的正则表达式语法: {"x" : /foobar/i}
  • 代码  文档中还能够包含JavaScript代码:{"x" : function() { /* …… */ }}
  • 二进制数据  二进制数据能够由任意字节的串组成。不过shell中没法使用。
  • 最大值  BSON包括一个特殊类型,表示可能的最大值。shell中没有这个类型。
  • 最小值  BSON包括一个特殊类型,表示可能的最小值。shell中没有这个类型。
  • 未定义  文档中也可使用未定义类型:{"x":undefined}
  • 数组  值的集合或者列表能够表示成数组:{"x" : ["a", "b", "c"]}
  • 内嵌文档  文档能够包含别的文档,也能够做为值嵌入到父文档中,数据能够组织得更天然些,不用非得存成扁平结构的:{"x" : {"food" : "noodle"}}

 

数字

  JavaScript中只有一种“数字”类型。由于MongoDB中有3种数字类型(32位整数、64位整数和64位浮点数),shell必须绕过JavaScript的限制。默认状况下,shell中的数字都被MongoDB当作是双精度数。这意味着若是你从数据库中得到的是一个32位整数,修改文档后,将文档存回数据库的时候,这个整数也被转换成了浮点数,即使保持这个整数原封不动也会这样的。因此明智的作法是尽可能不要在shell下覆盖整个文档。正则表达式

日期

  JavaScript的Date对象用作MongoDB的日期类型,建立一个新的Date对象时,一般会调用new Data("")。shell

 

 

基本概念

下面将按照学习RDMS时先介绍相似行、表、数据库概念的知识,而后在去学习增删改查等操做。数据库

1.文档

  文档是MongoDB中数据的基本单元(相似于关系型数据库中的行,可是比行要复杂得多)。多个键及其关联的值有序地放置在一块儿即是文档。MongoDB的文件存储格式为BSON。数组

  BSON是Binary JSON 的简称,是一个JSON文档对象的二进制编码格式。BSON同JSON同样支持往其它文档对象和数组中再插入文档对象和数组,同时扩展了JSON的数据类型。如:BSON有Date类型和BinDate类型。BSON有三个特色:轻量性、可遍历性、高效性服务器

  文档就能够这样表示:
  { "firstName": "egger", "lastName":"wong" }函数

  注意点:工具

  1. 文档中的键/值对是有序的。
  2. 文档中的值不只能够是在双引号里面的字符串,还能够是其余几种数据类型(甚至能够是整个嵌人的文档)。
  3. MongoDB区分类型和大小写。
  4. MongoDB的文档不能有重复的键。
  5. 文档的键是字符串。除了少数例外状况,键可使用任意UTF-8字符。
  • 键不能含有\0 (空字符)。这个字符用来表示键的结尾。
  • .和$有特别的意义,只有在特定环境下才能使用。
  • 如下划线"_"开头的键是保留的(不是严格要求的)。

2.集合

  集合就是一组文档(相似于关系型数据库中的表),能够被看作是没有模式的表。学习

  无模式

  集合是无模式的。这意味着一个集合里面的文档能够是各式各样的。例如,下面两个文档能够存在于同一个集合里面:
  {"name": "egger"}
  {"age":18}

  上面的文档不光是值的类型不一样(字符串和整数),它们的键也是彻底不同的。

  虽然集合里面能够放置任何文档,可是推荐使用多个集合:

  • 把各类各样的文档都混在一个集合里面,不管对于开发者仍是管理员来讲都是噩梦。
  • 在一个集合里面査询特定类型的文档在速度上也很不划算,分开作多个集合要快得多。
  • 把同种类型的文档放在一个集合里,这样数据会更加集中。
  • 当建立索引的时候,文档会有附加的结构(尤为是有惟一索引的时候)。索引是按照集合来定义的。把同种类型的文档放入同一个集合里面,可使索引更加有效。 

  命名

  咱们能够经过名字来标识集合。集合名能够是知足下列条件的任意UTF-8字符串。

  • 集合名不能是空字符串""。
  • 集合名不能含有\0字符(空字符),这个字符表示集合名的结尾。
  • 集合名不能以"system."开头,这是为系统集合保留的前缀。
  • 用户建立的集合名字不能含有保留字符,这是由于某些系统生成的集合中包含该字符。除非你要访问这种系统建立的集合,不然千万不要在名字里出现$。 

  子集合

  组织集合的一种惯例是使用"."字符分开的按命名空间划分的子集合。在MongoDB中使用子集合来组织数据是很好的方法

  例如,一个我的信息可能包含两个集合,分别是person.name和person.age。这样作的目的只是为了使组织结构更好些,也就是说person这个集合(这里根本就不须要存在)及其子集合没有任何关系。把数据库的名字放到集合名前面,获得就是集合的彻底限定名,称为命名空间。命名空间的长度不得超过121字节,在实际使用当中应该小于100字节。

  不少MongoDB工具中都包含子集合。

  • GridFS是一种存储大文件的协议,使用子集合来存储文件的元数据,这样就与内容块分开了
  • MongoDB的Web控制台经过子集合的方式将数据组织在DBTOP部分.
  • 绝大多数驱动程序都提供语法糖,为访问指定集合的子集合提供方便。

3.数据库

  MongoDB中多个集合能够组成数据库。MongoDB的单个实例能够容纳多个独立的数据库,每个都有本身的集合和权限,不一样的数据库也放置在不一样的文件中。

  数据库也经过名字来标识。数据库名能够是知足如下条件的任意UTF-8字符串。

  • 不能是空字符串("")。
  • 不得含有' '(空格)、.、$、/、\和\0 (空宇符)。
  • 应所有小写。
  • 最多64字节。

  有一些数据库名是保留的,能够直接访问这些有特殊做用的数据库。

• admin
从权限的角度来看,这是“root”数据库。要是将一个用户添加到这个数据库,这个用户自动继承全部数据库的权限。一些特定的服务器端命令也只能从这个数据库运行,好比列出全部的数据库或者关闭服务器。
• local
这个数据永远不会被复制,能够用来存储限于本地单台服务器的任意集合
• config
当Mongo用于分片设置时,config数据库在内部使用,用于保存分片的相关信息。

 

原文地址:http://www.cnblogs.com/egger/archive/2013/04/27/3047191.html

相关文章
相关标签/搜索