Greenplum的gpload工具使用可读外部表和Greenplum并行文件服务器(gpfdist或者gpfdists)来装载数据。它处理并行的基于文件的外部表设置而且容许用户在一个单一配置文件中配置他们的数据格式、外部表定义以及gpfdist或者gpfdists设置。使用gpload工具,须要编写gpload的控制文件,这个控制文件是一个yaml格式文件,以下图所示:
而后执行gpload进行装载操做,以下:
控制文件的说明:
一、gpload的控制文件,同级的参数必定要保持一致的缩进;
二、"-"后面必定要有空格,若是":"后面要跟参数值,那么":"后面也必定要有空格;
三、gpload控制文件中也能够写一些SQL语句,如上图中,装载以前(before)truncate表,装载完成后(after)收集表的统计信息;
四、针对gpfdist的参数,也能够在控制文件中指定,好比上述指定了MAX_LINE_LENGTH、port参数。
详细的参数说明以下图所示:
参考文献:
一、gpload官方手册。
二、Greenplum中文手册
三、单独安装Greenplum Loaders请参考这篇文章。html