再谈GenericUDAF(以collect_set源码分析)

        最近对Generic UDAF思索了一下,感受最关键的是理解UDAF执行的每一步过程的输入与输出,其实步骤根听说明来编写相关代码就基本没问题,可是须要注意的是,数据类型须要统一,建议使用 Hadoop 数据类型,即分布式对象。实践中证明使用writable系列的类型比java系列的类型简单. 不要尝试同时使用二种系列的类型, 中间容易出现ClassCastException.jav
相关文章
相关标签/搜索