HAWQ取代传统数仓实践(三)——初始ETL(Sqoop、HAWQ)

HAWQ取代传统数仓实践(三)——初始ETL(Sqoop、HAWQ) 一、用sqoop用户建立初始抽取脚本   本示例要用Sqoop将MySQL的数据抽取到HDFS上的指定目录,然后利用HAWQ外部表功能将HDFS数据文件装载到内部表中。表1汇总了示例中维度表和事实表用到的源数据表及其抽取模式。 源数据表 HDFS目录 对应EXT模式中的表 抽取模式 customer /data/ext/cust
相关文章
相关标签/搜索