2020-09-27【学习笔记】【企业数据湖】五、基于Apache Sqoop的批量数据获取

一、数据湖背景中的数据获取 1、数据获取层 2、批量数据获取--技术路线图 二、为什么使用sqoop sqoop是一款非常常用的用于向ApacheHadoop传输数据的工具 1、sqoop简史 最早由cloudera开发维护,分为1.X,2.X版本,区别很大 2、sqoop的优势 支持多种结构化数据 sqoop可以将etl中某些环境剔除,转移到hadoop中执行 sqoop可以以并行的方式传输数据
相关文章
相关标签/搜索