Greenplum记录(一):主体结构、master、segments节点、interconnect、performance monitor

  结构:Client——master host——interconnect——segment hostsql

每一个节点都是单独的PG数据库,要得到最佳的性能须要对每一个节点进行独立优化。数据库

master上不包含任何的用户数据,仅保留system catalog,用户数据所有存储在segments上。网络

master负责处理传入的sql命令,分发到对应的segments上,组合返回的结果并返回给客户端。ide

Because the master does not contain any user data, it has very little disk load. The master needs a fast, dedicated CPU for data loading, connection handling, and query planning because extra space is often necessary for landing load files and backup files, especially in production environments. Customers may decide to also run ETL and reporting tools on the master, which requires more disk space and processing power.性能


master节点备份:When an the standby master is active, the replicated logs are used to reconstruct the state of the master host at the time of the last successfully committed transaction.优化

虽然用户数据存储在segments上面(每一个节点存储的数据互补相同),但用户是经过master节点来操控的。每台主机的segments个数由性能决定。ui

镜像segments节点必须部署在不一样的主机上:1.group mirroring,把每一个segments节点放在另一台主机上(已经存在segments节点);spread mirroring,讲segments节点存放在空闲主机上(要求空闲主机数量大于segments节点数)。spa

当master节点认为某个segments节点不可用时,会把它剔除搜索范围,自动启用备用节点。管理员能够从新将它设为启用,不论系统是否正在运行,恢复程序会自动修复丢失的数据。若是某个segments节点挂掉而且没有备用节点,系统会自动shutdown,直到管理员将全部挂掉的节点恢复(防止返回错误的数据)。ci

GPDB性能取决于最慢的那个segments节点(木桶原理)。为了获取最佳性能,segments节点主机应该是独立的,没有其余程序占用资源。资源

segments节点硬盘结构:每一个cpu对应一个逻辑硬盘,一个逻辑硬盘对应一组物理硬盘。

每一个节点的hosts文件须要配置其余全部的主机名及host address,这样GPDB就能够自动均衡网络使用。

性能监控是每一个segments节点都有一个任务,收集节点数据及系统利用率,每隔一段时间(默认15s)返回给master,查询这些数据便可查看节点的性能。

相关文章
相关标签/搜索