HAWQ取代传统数仓实践(四)——按期ETL(Sqoop、HAWQ)

1、变化数据捕获(CDC)        初始装载只在数据仓库开始使用前执行一次,然而,必需要周期性地执行装载源数据过程。与初始装载不一样,按期装载通常都是增量的,而且须要捕获而且记录数据的变化历史。 1. 识别数据源与装载类型        按期装载首先要识别数据仓库的每一个事实表和每一个维度表用到的而且是可用的源数据。而后要决定适合装载的抽取模式和维度历史装载类型。表1总了本示例的这些信息。
相关文章
相关标签/搜索