couchDB简介1

时间 2019-11-12

标签 couchdb 简介繁體版

原文原文链接

目
录

1简介web
2特性数据库
应用场景json
特点服务器
3实现网络
4结构并发
5ACID分布式
6View Serveride
View Model函数
JavaScriptspa

1 简介

CouchDB是用Erlang开发的面向文档的数据库系统，最近刚刚发布了1.0版本。CouchDB不是一个传统的关系数据库，而是面向文档的数据库，其数据存储方式有点相似lucene的index文件格式，CouchDB最大的意义在于它是一个面向web应用的新一代存储系统，事实上，CouchDB的口号就是：下一代的Web应用存储系统。

2 特性

RESTFul API：HTTP GET/PUT/POST/DELETE + JSON

基于文档存储，数据之间没有关系范式要求

每一个数据库对应单个个文件(以JSON保存),Hot backup

MVCC（Multi-Version-Concurrency-Control），读写均不锁定数据库

用户自定义View

内建备份机制

支持附件

使用Erlang开发（更多的特性）

应用场景

在咱们的生活中，有不少document，好比信件，帐单，笔记等，他们只是简单的信息，没有关系的需求，咱们可能仅仅须要存储这些数据。这样的状况下，CouchDB应该是很好的选择。固然其余使用关系型数据库的环境，也可使用CouchDB来解决。

特点

在某些偶尔链接网络的应用中，咱们能够用CouchDB暂存数据，随后进行同步。也能够在Cloud环境中，做为分布式的数据存储。CouchDB提供给予HTTP的API，这样全部的常见语言均可以使用CouchDB。

使用CouchDB，意味着咱们不须要在像使用RMDBS同样，在设计应用前首先设计负责数据Table。咱们的开发更加快速，灵活。

3 实现

在CouchDB中，Database表示一个数据库，每一个Database对应一个”Storage”（后缀为.couch）以及多个View Index(用来存储View结果支持query）。

Database Storage中能够存储任意的Document，用户能够在Database中自定义View，方便对数据进行查询, View 默认使用JavaScript进行定义，定义好的相关函数保存在design document 中，而View对应的具体数据是保存在View Index文件中。咱们能够经过HTTP API请求Database，Document，View，能够进行简单的Query，以及其余各类系统相关的信息。

4 结构

数据库文件的后缀为.couch，由Header和Body组成。

Header

包含两个彻底相同的Header信息，每一个Header的Size为2048

Header中前4字节为magic code:$g, $m, $k, 0

随后为header的payload，经过term_to_binary(db_header_record)产生

接下来是填充padding

最后是16字节的摘要信息(md5(payload+padding)产生)

Header总长度为：单个Header * 2 = 2048

Body

由两个B+Tree组成，其中一个B+Tree根据Document id进行组织，另外一个B+Tree以 seqnum（CouchDB内部使用的序号，用来指示最新Revision的文档）为 key。

fulldocinfo_by_id_btree使用Document id做为key，经常使用来根据id来查找对应的document，full_doc_info中包含对应document的全部的Revision信息，经过这些信息，咱们能够获取指定Revision的document

docinfo_by_seq_btree使用seq做为key，当document被更新时，对应的seq会增长。

具体的document数据（json格式），以及B+Tree混合存储与这个.couch文件之中。经过B+Tree，咱们能够快速的定位到指定的document。

CouchDB全部的更新操做（包括document的建立，修改和删除）都是以在couch文件尾部追加的方式（即Append方式）进行。咱们进行更新时，首先拷贝原有的数据信息（仅仅针对修改，若是是Create那么就没有copy可言了），随后将其追加到文件的结尾，这个时候就激发 B+Tree从 leaf到root的更新过程，更新的Node信息也是采用Append的方式写入到文件的结尾，到达根节点时，咱们将根节点信息写入到Header中。这样一次更新操做涉及1次数据写入，以及LogN次节点更新，因此其复杂度为O(logN)。

所以采用追加的方式，因此在数据库运行一段时间后，咱们须要对其进行“瘦身”，清理那些旧的Document数据。这个过程称为Compaction。在 Compation 的过程当中，数据库仍然可用，只是请注意，在 Compation 的时候，是经过遍历 DBName.couch 文件，将最新的数据拷贝到一个 DBName.compat文件中，所以这个过程可能会耗费很大的存储空间，若是您在系统繁忙（主要是write）的状况下进行Compation，可能会致使你的硬盘空间耗尽，必定注意哦！

5 ACID

CouchDB支持ACID特性。Document的更新（add，edit，delete）是顺序进行的，可是Database的read为并发执行，其没必要等待任何其余的read，write的完成。这样的特性与CouchDB存储文件的Append增长方式关系密切。

当CouchDB的文档更新时，为了保证数据的一致性，Commit分为如下两步：

Document数据和index数据首先写入到disk数据库文件

生成两个连续的头信息（4kb),随后写入数据库文件

在上面两个过程当中，若是在过程1，发生异常（系统崩溃或断电），那么couch文件的头信息没有发生变化，那么全部Append的数据都会被忽略；若是在过程2发生异常，此时Header可能会发生损坏，咱们验证第一个Header和第二个Header，若是任意一个Header可用，那么数据库文件可用。若是两个Header都不可用，则对应数据库文件损坏，抛出异常。

一些数据库系统，为了实现 Atomic Commit ，提交数据前，将内容写入到一个rollback log文件，等提交完成后，删除log文件。

6 View Server

除了存储数据，咱们还须要依据咱们的要求展示数据，乃至一些统计，所以CouchDB中引入了View的概念。View的引入让CouchDB从一个有趣的文件存储系统，步入了数据库的殿堂。也使CouchDB可以融入到真正的应用环境中。

CouchDB中全部的Document均可以具备本身不一样的结构，数据，这和关系型数据库中，严格的表结构，严格的关联彻底不一样。这样的特色对于数据的备份同步却很是有好处！

View Model

经过用户自定义View，咱们能够聚集，统计数据，采用一个相似Map/Reduce的过程。这里的Map将原始的Document进行映射处理，Reduce将Map的中间结果进行从新归并统计，总而生成最终结果。这里和并行计算中的Map/Reduce有些不一样。

CouchDB的View针对每一个Database，可是其与Database关联性不是很大，View是一些用户自定义函数，处理从数据库的Document 输入，产生中间数据（若是没有reduce过程则为最终数据），而后再经过Reduce处理中间输出，产生最终结果。一样的View可使用在不一样的Database上。

View存储在design Document中，请注意这里design Document和View Index是不一样的。design Document保存的是view的定义，View Index保存的是针对某个Database进行View操做，产生的结果。

JavaScript

CouchDB内部默认使用JavaScript做为View的编写语言，之因此采用Javascript，是和CouchDB面向Web开发相关的。CouchDB使用Mozilla的spidermonkey做为JavaScript的解析运行平台，为了和Erlang进行交互，其使用c书写了一个Port程序couchjs，/server/main.js做为View Server服务器。

在启动CouchDB时，经过Command：couchjs main.js便可启动基于JavaScript的View Server。

View中包含两个函数:

(map函数，必须）function(doc) { emit(null, doc);}(reduce函数，可选）function (key, values, rereduce) { return sum(values);}

doc,为咱们数据库对应的Document，由于咱们采用JSON格式存储数据，因此 Document 在 JavaScript 中转化为 Object。`emit(null,doc)`用来生成 map 的中间结果，其中第一个参数 null 表示结果的 key，第二个参数为结果的 value，上面的例子中咱们的结果为:

null, value1...null, valueN

function (key, values, rereduce)中，根据rereduce变量不一样这里有两种状况:

1. rereduce为false

key为array，element为：[key,id]，key为map function产生的key，id为Document对应id

values为array，elements为map function产生的结果

好比 reduce([ [key1,id1], [key2,id2], [key3,id3] ], [value1,value2,value3], false)

2. rereduce为true

key为null

values为array，element为前一次reduce返回的结果

好比reduce(null, [intermediate1,intermediate2,intermediate3], true)

不少时候，咱们一次调用reduce就能够生成最终结果，咱们会忽略rereduce参数。^[1]

1. couchDB简介2
2. 开源数据库之MongoDB，Cassandra，CouchDB，HBase 等简介
3. couchdb入门指南1——环境搭建和简单的调试
4. treesoft,couchDB,
5. NoSQL--couchdb
6. couchDB-replication
7. 1.python简介
8. 1.Swift 简介
9. 1、ARM简介
10. 1,ActiiveMq简介
更多相关文章...
• Scala 简介 - Scala教程
• AJAX 简介 - PHP教程
• Github 简明教程
• Java Agent入门实战（一）-Instrumentation介绍与使用