大数据数据库技术简介与分类分析

大数据生态数据库

数据库技术 传统vs新型服务器

从大的角度讲,能够简单的将数据库分为两类:网络

●传统SMP架构的数据库,主要指代的是传统的关系型数据库,例如DB二、Postgrel,MySQL等。架构

●新型数据库,主要指代为支持大规模数量集,高并发要求,高可扩展性等孕育而生的新型数据库。包括目前大数据生态当中主流MPP,NoSQL,NewSQL数据库等并发

在这里我仍是要推荐下我本身建的大数据学习交流qq裙: 957205962, 裙 里都是学大数据开发的,若是你正在学习大数据 ,小编欢迎你加入,你们都是软件开发党,不按期分享干货(只有大数据开发相关的),包括我本身整理的一份2018最新的大数据进阶资料和高级开发教程,欢迎进阶中和进想深刻大数据的小伙伴分布式

传统数据库和新型数据库的一个主要区别是SMP架构VS分布式/并行高并发

数据库理论基础学习

理论基础 - 服务器系统架构大数据

●SMP(Symmetric Multi-Processor)spa

SMP是对称多处理器结构的简称,指代多个CPU对称工做,无主次或从属关系。各个CPU共享相同的物理内存,每一个CPU访问内存中的任何地址的路径是相同的(访问的时间是相同的),所以SMP也被称为一致存储器访问结构(UMA: Uniform Memory Access)。

●NUMA(Non-Uniform Memory Access)

NUMA是非对称的多处理结构,恰好与SMP相对,多个CPU工做时,对内存的访问路径不一样。NUMA架构的提出主要是解决SMP架构下多CPU扩展的问题。

●MPP(Massive Parallel Processing)

和NUMA不一样,MPP提供了另外一种进行系统扩展的方式。它由多个SMP服务器经过必定的节点互联网络进行链接,协同工做,完成相同的任务,从用户的角度来看是一个服务器系统。

SMP和NUMA都主要指向单一的计算机系统,而MPP则有点集群的意思了

理论基础 - ACID基本理论

●原子性(Atomic)

整个事务要么成功,要么失败,杜绝部分红功

●一致性(Consistent)

事务的运行并不改变数据库中数据的一致性。例如,完整约束了a+b=10,一个事务改变了a,那么b也应该随之改变

●独立性(lsolated)

也称做隔离性,指两个以上的事务不会出现交错执行的状态,由于这样不可能会致使数据不一致

●持久性(Durable)

事务执行成功之后,该事务所对数据库作的更改即是持久的保存在数据库之中,不会平白无故的回滚

传统基于关系模型的数据库听从ACID基本理论,而新型分布式数据库则并不彻底听从该理论

理论基础 - 分布式CAP理论

 

 

 

       ●一致性(Consistent)

即数据的⼀一致性,简单的说就是数据复制到N台机器,若是有更新,要N台机器的数据一块儿更新

       ●可用性(Availability)

在集群中一部分节点故障后,集群总体还能响应客户端的读写请求

       ●分区容错性(Tolerance)

       分区发生但不影响整个系统的运行

在这里我仍是要推荐下我本身建的大数据学习交流qq裙: 957205962, 裙 里都是学大数据开发的,若是你正在学习大数据 ,小编欢迎你加入,你们都是软件开发党,不按期分享干货(只有大数据开发相关的),包括我本身整理的一份2018最新的大数据进阶资料和高级开发教程,欢迎进阶中和进想深刻大数据的小伙伴

        基于传统关系型模型数据库更关注CA,新型NoSQL数据库更关心CP,AP