所谓网关机是指经过该机器来访问hadoop集群,由于在实际的生产环境中一般不是直接将pig安装到hadoop集群中的某个节点上,而是在一台可以访问hadoop集群的机器上安装pig。pig只是做为一个特殊的hadoop客户端,它能够使用local模式也能够使用mapreduce模式,在生产环境中pig都是使用mapreduce模式的,因此它须要hadoop集群的hdfs与mapreduce的支持,通俗的说就是pig客户端可以肯定NameNode与JobTracker的位置,而这两个信息都是经过hadoop安装目录中conf目录下的配置文件中肯定的,因此pig只须要定位到hadoop的conf目录便可。ide
配置pig方法:oop
在pig的解压目录的bin目录下的pig执行脚本中添加一个变量:PIG_CLASSPATH=${HADOOP_HOME}/conf就好了,而后直接运行pig就能够看到日志输出已经链接到hadoop集群了。日志