Hadoop组件,(ETL数据清洗)Pig,Sqoop文件搬运工具基础操做

pig组件mysql 基本定义:正则表达式 1.字段 field 做为基本的元素sql 2.n个字段组成一个元组 tuple数据库 3.n个元组组成一个包 bag(nd表或者平面表)app 其实全部的操做都会被计算机迭代遍历,快速迭代抽象成了行列级操做函数 PIG 加载和保存所支持的文件格式:oop -------------------------------------------------
相关文章
相关标签/搜索