第1篇:GreenPlum的介绍/架构

1、GreenPlum介绍

GreenPlum是基于数据库分布式架构的开源大数据平台;采用无共享(no shareing)的MPP架构;具备良好的线性扩展能力,具备高效的并行运算、并行存储特性。拥有独特的高效的ORCA优化器。兼容SQL语法。适合用于高效PB数据量级的存储、处理和实时分析能力。因为内核是基于PostgreSQL数据库;也支持涵盖OLTP型业务混合负载。同时数据节点和主节点都有本身备份节点。提供数据库的高可用性。html

2、GreenPlum架构

 

架构算法

在GreenPlum数据库中组件;从上图能够看出Master节点、Segment节点、interconnect数据库

  • Master节点:为主节点;做为数据库的入口,负责客服端链接;对客服端的请求生成查询计划;分发给某个或者全部的Segment节点。
  • standby master: 做为master节点的备库;为其提供高可用性。在Master节点出现故障;经过gpactivestandby命令激活。接管master工做
  • interconnect:是GreenPlum的网络层;负责每一个节点之间的通讯。
  • segment节点:为数据节点;接收master分发下来的查询计划;执行返回结果给master节点
  • mirror segment节点: 做为segment节点的备库;为了提供高可用性;一般跟对应的segment节点不在同一台机器上。在segment节点出现故障,mirror segment自动接管进行工做。可是为了数据库平稳;尽快恢复出现故障的segment。

对用户而言能够把整个GreenPlum数据库当成PostgreSQL数据库。网络

Greenplum数据库可使用追加优化(append-optimized,AO)的存储个事来批量装载和读取数据,而且能提供HEAP表上的性能优点。 追加优化的存储为数据保护、压缩和行/列方向提供了校验和。行式或者列式追加优化的表均可以被压缩。架构

3、Greenplum数据库和PostgreSQL的主要区别在于:

  • 在基于Postgres查询规划器的常规查询规划器以外,能够利用GPORCA进行查询规划。
  • Greenplum数据库可使用追加优化的存储。
  • Greenplum数据库能够选用列式存储,数据在逻辑上仍是组织成一个表,但其中的行和列在物理上是存储在一种面向列的格式中,而不是存储成行。列式存储只能和追加优化表一块儿使用。列式存储是可压缩的。当用户只须要返回感兴趣的列时,列式存储能够提供更好的性能。 全部的压缩算法均可以用在行式或者列式存储的表上,可是行程编码(RLE)压缩只能用于列式存储的表。Greenplum数据库在全部使用列式存储的追加优化表上都提供了压缩。

Greenplum如何存储在下面章节讲解。app

参考文献:https://greenplum.cn/gp6/intro/arch_overview.html分布式

备注:以上为本人理解;如有不对的地方;烦请指出。谢谢!性能

相关文章
相关标签/搜索