hive: 自定义UDTF

在hive项目中, 有client和server通信的log日志体系如下,中间的网络传输使用的json格式,所以在server端接收时需要使用阿里的fastJSON来解析为日志聚合体LogAgg类;然后使用自定义表生成函数UDTF, 分别取出Error表, Event表,StartUp表的数据, 数据转储到各表中,完成日志的初步ETL。 所以,这个UDTF如何定义? 类似于上篇的自定义UDF函数,
相关文章
相关标签/搜索