GREENPLUM简介

什么是GREENPLUM?数据库

对于不少IT人来讲GREENPLUM是个陌生的名字。简单的说它就是一个与ORACLE, DB2同样面向对象的关系型数据库。咱们经过标准的SQL能够对GP中的数据进行访问存取。

GREENPLUM与其它普通的关系型数据库的区别?
服务器

本质上讲GREENPLUM是一个关系型数据库集群. 它其实是由数个独立的数据库服务组合成的逻辑数据库。与RAC不一样,这种数据库集群采起的是MPP架构。以下图所示网络


它 的组件分红三个部分MASTER/SEGMENT以及MASTER与SEGMENT之间的高效互联技术GNET。其中MASTER和SEGMENT自己就 是独立的数据库SERVER。不一样之处在于,MASTER只负责应用的链接,生成并拆分执行计划,把执行计划分配给SEGMENT节点,以及返回最终结果 给应用,它只存储一些数据库的元数据,不负责运算,所以不会成为系统性能的瓶颈。这也是GREENPLUM与传统MPP架构数据库的一个重要区别。 SEGMENT节点存储用户的业务数据,并根据获得执行计划,负责处理业务数据。也就是用户关系表的数据会打散分布到每一个SEGMENGT节点。当进行数 据访问时,首先全部SEGMENT并行处理与本身有关的数据,若是须要segment能够经过进行innterconnect进行彼此的数据交互。 segment节点越多,数据就会打的越散,处理速度就越快。所以与SHARE ALL数据库集群不一样,经过增长SEGMENT节点服务器的数量,GREENPLUM的性能会成线性增加。


GREENPLUM适用场景?

GREENPLUM虽然是关系型数据库产品,它的特色主要就是查询速度快,数据装载速度快,批量DML处理快。并且性能能够随着硬件的添加,呈线性增长,拥有很是良好的可扩展性。所以,它主要适用于面向分析的应用。好比构建企业级ODS/EDW,或者数据集市等等。


GREENPLUM运行的平台?

GREENPLUM运行在X86架构的硬件平台上,目前支持的操做系统包括32/64位的 LINUX(REDHAT/SUSE)/SOLARIS/MAC OS

GREENPLUM的前景?

GREENPLUM 诞生于2003年硅谷,2010/07 EMC收购了GREENPLUM,并把GREENPLUM做为EMC面向分析云的战略核心产品,加以大力发展。该产品不只在国际市场发展很快,在国内市场 发展也很快。最著名的案例就是阿里巴巴集团,通过多种产品的精心选型,最终选择GREENPLUM做为它们的数据仓库平台存放数百TB的业务数据去高效支 持各类分析应用。


如何学习GREENPLUM?

正是因为产品发展速度很快,可是在相关人才上存在很大缺口。所以,我我的认为对于各位有兴趣的技术人员来讲,是一个很好的职业发展机会。以我的经验来讲, 只要有其它关系型数据库的基础,尤为是POSTGRESQL或者INFORMIX基础的(由于GREENPLUM是在POSTGRESQL基础上开发出来 的),很容就能够上手学习并掌握GREENPLUM。
GREENPLUM的手册写的很是好,彻底能够做为入门的教材使用。其软件自己也是软性LICENSE,用于学习研究彻底免费,并且与生产环境并没有不一样,这与ORACLE彻底同样。

如何下载GREENPLUM的资料?

官方途径能够从网站 HTTP://gpn.greenplum.com上下载手册和软件。但国内因为网络问题,可能不太好用。但愿论坛或者哪位同志能提供一个好用的网盘,我愿意与你们分享相关软件和资料
架构

相关文章
相关标签/搜索