NoSQL 数据库的使用场景

摘要:对比传统关系型数据库,NoSQL有着更为复杂的分类——键值、面向文档、列存储、图数据库。这里就带你一览NoSQL各类类型的适用场景及一些知名公司的方案选择。sql

 

在过去几年,关系型数据库一直是数据持久化的惟一选择,数据工做者考虑的也只是在这些传统数据库中作筛选,好比SQL Server、Oracle、MySQL。甚至是作一些默认的选择,好比使用.NET的通常会选择SQL Server;使用Java的可能会偏向Oracle;Ruby是MySQL;Python则是PostgreSQL或MySQL等等。数据库

缘由很简单:过去很长一段时间内,关系数据库的健壮性已经在多数应用程序中获得证明。咱们可使用这些传统数据库良好的控制并发操做、事务等等。然而若是传统的关系型数据库一直这么可靠,那么还有NoSQL什么事?NoSQL之因此生存并获得发展,是由于它作到了传统关系型数据库作不到的事!网络

关系型数据库中存在的问题数据结构

Impedance Mismatch(阻抗失配)并发


咱们使用Python、Ruby、Java、.Net等语言编写应用程序,这些语言有一个共同的特性——面向对象。可是咱们使用MySQL、PostgreSQL、Oracle、SQL Server,这些数据库一样有一个共同的特性——关系型数据库。这里就牵扯到了“Impedance Mismatch”这个术语:存储结构是面向对象的,可是数据库倒是关系的,因此在每次存储或者查询数据时,咱们都须要作转换。相似Hibernate、Mybatis、Entity Framework这样的ORM框架确实能够简化这个过程,可是在对查询有高性能需求时,这些ORM框架就捉襟见肘了。框架

应用程序规模的变大nosql

网络应用程序的规模日渐变大,咱们须要储存更多的数据、服务更多的用户以及需求更多的计算能力。为了应对这种情形,咱们须要不停的扩展。ide

扩展分为两类:性能

1) 纵向扩展,即购买更好的机器,更多的磁盘、更多的内存等等;spa

2) 横向扩展,即购买更多的机器组成集群。在巨大的规模下,纵向扩展发挥的做用并非很大。

首先单个机器性能提高须要巨额的开销而且有着性能的上限,在Google和Facebook这种规模下,永远不可能使用一台机器支撑全部的负载。鉴于这种状况,咱们须要新的数据库,由于关系数据库并不能很好的运行在集群上。固然,你也可能会去搭建关系数据库集群,可是他们使用的是共享存储,这并非咱们想要的类型。因而就有了以Google、Facebook、Amazon这些试图处理更多传输所引领的NoSQL纪元。

NoSQL纪元

当下已经存在不少的NoSQL数据库,好比MongoDB、Redis、Riak、HBase、Cassandra等等。每个都拥有如下几个特性中的一个:

 

  • 再也不使用SQL语言,好比MongoDB、Cassandra就有本身的查询语言
  • 一般是开源项目
  • 为集群运行而生
  • 弱结构化——不会严格的限制数据结构类型

 

NoSQL数据库的类型

NoSQL能够大致上分为4个种类:Key-value、Document-Oriented、Column-Family Databases、Graph-Oriented Databases。

1、 键值(Key-Value)数据库

键值数据库就像在传统语言中使用的哈希表。你能够经过key来添加、查询或者删除数据,鉴于使用主键访问,因此会得到不错的性能及扩展性。

产品:Riak、Redis、Memcached、Amazon’s Dynamo、Project Voldemort

有谁在使用:GitHub (Riak)、BestBuy (Riak)、Twitter (Redis和Memcached)、StackOverFlow (Redis)、 Instagram (Redis)、Youtube (Memcached)、Wikipedia(Memcached)

1适用的场景

储存用户信息,好比会话、配置文件、参数、购物车等等。这些信息通常都和ID(键)挂钩,这种情景下键值数据库是个很好的选择。

2不适用场景

1) 取代经过键查询,而是经过值来查询。Key-Value数据库中根本没有经过值查询的途径。

2) 须要储存数据之间的关系。在Key-Value数据库中不能经过两个或以上的键来关联数据。

3) 事务的支持。在Key-Value数据库中故障产生时不能够进行回滚。

 

2、 面向文档(Document-Oriented)数据库

面向文档数据库会将数据以文档的形式储存。每一个文档都是自包含的数据单元,是一系列数据项的集合。每一个数据项都有一个名称与对应的值,值既能够是简单的数据类型,如字符串、数字和日期等;也能够是复杂的类型,若有序列表和关联对象。数据存储的最小单位是文档,同一个表中存储的文档属性能够是不一样的,数据可使用XML、JSON或者JSONB等多种形式存储。

产品:MongoDB、CouchDB、RavenDB

有谁在使用:SAP (MongoDB)、Codecademy (MongoDB)、Foursquare (MongoDB)、NBC News (RavenDB)

1适用的场景

1) 日志。企业环境下,每一个应用程序都有不一样的日志信息。Document-Oriented数据库并无固定的模式,因此咱们可使用它储存不一样的信息。

2) 分析。鉴于它的弱模式结构,不改变模式下就能够储存不一样的度量方法及添加新的度量。

2不适用场景

在不一样的文档上添加事务。Document-Oriented数据库并不支持文档间的事务,若是对这方面有需求则不该该选用这个解决方案。

 

3、 列存储(Wide Column Store/Column-Family)数据库

列存储数据库将数据储存在列族(column family)中,一个列族存储常常被一块儿查询的相关数据。举个例子,若是咱们有一个Person类,咱们一般会一块儿查询他们的姓名和年龄而不是薪资。这种状况下,姓名和年龄就会被放入一个列族中,而薪资则在另外一个列族中。

产品:Cassandra、HBase

有谁在使用:Ebay (Cassandra)、Instagram (Cassandra)、NASA (Cassandra)、Twitter (Cassandra and HBase)、Facebook (HBase)、Yahoo!(HBase)

1. 适用的场景

1) 日志。由于咱们能够将数据储存在不一样的列中,每一个应用程序能够将信息写入本身的列族中。

2) 博客平台。咱们储存每一个信息到不一样的列族中。举个例子,标签能够储存在一个,类别能够在一个,而文章则在另外一个。

2. 不适用场景

1) 若是咱们须要ACID事务。Vassandra就不支持事务。

2) 原型设计。若是咱们分析Cassandra的数据结构,咱们就会发现结构是基于咱们指望的数据查询方式而定。在模型设计之初,咱们根本不可能去预测它的查询方式,而一旦查询方式改变,咱们就必须从新设计列族。

 

4、 图(Graph-Oriented)数据库

图数据库容许咱们将数据以图的方式储存。实体会被做为顶点,而实体之间的关系则会被做为边。好比咱们有三个实体,Steve Jobs、Apple和Next,则会有两个“Founded by”的边将Apple和Next链接到Steve Jobs。

产品:Neo4J、Infinite Graph、OrientDB

有谁在使用:Adobe (Neo4J)、Cisco (Neo4J)、T-Mobile (Neo4J)

1适用的场景

1) 在一些关系性强的数据中

2) 推荐引擎。若是咱们将数据以图的形式表现,那么将会很是有益于推荐的制定

2不适用场景

不适合的数据模型。图数据库的适用范围很小,由于不多有操做涉及到整个图。

 

英文原文: NoSQL Databases, why we should use, and which one we should choose

 

参考推荐:

一网打尽当下NoSQL类型、适用场景及使用公司

全球著名互联网企业背后的开源力量

相关文章
相关标签/搜索