公司使用chukwa收集每一个服务器数据的,数据收集到的hdfs之后被写成sequencefile,想用pig处理这些数据,pig自己不支持这种数据结构的,查看chukwa源码发现,自己有带有pig脚本,是hicc用来作数据统计的脚本,hicc一直很差使,也懒得搭理这玩意。apache
一、chukwa/script/pig/DF.pig服务器
define chukwaLoader org.apache.hadoop.chukwa.pig.ChukwaLoader();数据结构
源码在:chukwa/contrib/chukwa-pig下边oop
自己chkwa支持的pig版本比较老,使用pig脚本加载这个jar包,执行压根很差使,把代码放到pig下进行编译,就能够直接使用了。
ip