Pig详解

1.   整体描述 Pig包括两部分:①用于描述数据流的语言,称为Pig Latin;②用于运行Pig Latin程序的执行环境,当前有两个环境:单JVM中的本地执行环境和hadoop集群上的分布式执行环境。 一个Pig Latin程序有一系列的操作和变换组成。每个操作或变换对输入进行数据处理,然后产生输出结果。这些操作整体上描述了一个数据流。Pig执行环境把数据流翻译为可执行的内部表示,并运行它
相关文章
相关标签/搜索