原文地址:http://www.fromgeek.com/ai/15...html
最近吴宁川一篇《厉害了,蚂蚁金服!创造了中国本身的数据库OceanBase》报道了OceanBase诞生的来龙去脉。内容很是详实,值得分享。同时本身也分享几点杂想:数据库
第一,杀熟不只仅是大数据时代的产物服务器
以前从某网平台爆出的订购酒店或者是约车出行的杀熟案例。说明大数据时代咱们每一个人都处于一个小白,随时宰割的状态。分布式
其实这种现象在各个领域都存在。好比,技术壁垒也是杀熟的条件之一。就像文章中谈到的,王坚在2008年阿里的时候,提出的去IOE行为。就是由于技术壁垒产生的杀熟状况。正常来看,IT采购是一个促进企业效率的工具。可是采购包括向小型机、高端存储、数据库,其采购的越多,成本是呈现几何式增加。其IT采购不在是促进因素,甚至严重的阻碍了企业的发展。工具
就像IOE这样的设备在阿里云业务大规模发展过程当中,带来的成本愈来愈高。对于阿里来讲,失去了其技术促进生产的原动力。在这样的状况下,蚂蚁金服自主研发的OceanBase数据库。区块链
第二,真正的分布式数据库诞生,打破了传统的“数据湖”概念。大数据
何为传统的“数据湖”概念,就是把多个物理上的磁盘当作是虚拟的一个存储单元,OceanBase 团队SQL开发方向负责人陈萌萌的说法是把全部的数据库看到的是同一个数据磁盘、共享数据访问,能够确保全部的数据均可被访问到,可是对硬件要求提出很高的要求,就是底层硬件自己要稳定可靠。能够看到这种理念被绝大多数的传统企业甚至包括互联网企业所接受。优化
而阿里打破了这个理念,全球仅有两家企业打破了这个理念,一个是阿里,一个是Google。
陈萌萌认为目前真正的分布式数据库全球仅有两家,阿里的OceanBase,以及谷歌于2017年2月发布的所有自研的Spanner分布式数据库云服务。阿里云
即便是AWS推出的Aurora数据库,其设计原理更接近于传统数据库的共享磁盘设计。
具体来说OceanBase在处理数据访问的时候,至关于把一台原来的小型机或存储设备从纵向“切片”成不少机器,再把数据分布到这些分散在不一样的机器上,我的理解应该是把一个总体“数据湖”分红了多个小的“数据池”。.net
OceanBase的一个基础设计思想是把每一份数据存放在三台不一样的机器上,那么一台PC服务器出故障的几率为千分之一的话,两台同时坏的几率可能就是百万分之一,三台同时坏的几率则是十亿分之一。
第三,OceanBase分布式数据库是否能够与区块链技术结合?
首先咱们看到王坚提出阿里要建设分布式数据库与中本聪提出的比特币白皮书是同一个时期。这里咱们看到,从2009年开始,王坚就在考虑一个真正适应将来互联网业务的分布式数据库。你们能够换个角度看,也是在同一时期,中本聪提出了一种点对点的电子货币系统,其背后采用的区块链(被人们戏称也叫作“有史以来最慢的分布式数据库”)技术。
不一样的是,Oceanbase做为一个商业项目,通过这几年的不断发展,单纯看这个数据库,既实现了分布式的数据存储,又作到了数据库查询优化。在真是应用场景上,相对于传统的银行柜台,人工窗口提供服务花费大量的时间得到服务,蚂蚁金服基于oceanbase提供的互联网金融应用,为用户提供了优质的互联网服务体验。
全部区块链这种缓慢的分布式数据库技术,能够参考阿里的Oceanbase或者Google的Spanner数据库技术。这样,对于区块链技术的推动有着积极的做用。