基于Hadoop生态圈的数据仓库实践 —— ETL(二)

2、使用Hive转换、装载数据 1. Hive简介 (1)Hive是什么         Hive是一个数据仓库软件,使用SQL读、写、管理分布式存储上的大数据集。它创建在Hadoop之上,具备如下功能和特色: 经过SQL方便地访问数据,适合执行ETL、报表、数据分析等数据仓库任务。 提供一种机制,给各类各样的数据格式加上结构。 直接访问HDFS的文件,或者访问如HBase的其它数据存储。 能够经
相关文章
相关标签/搜索