SparkSQL 自定义算子UDF、UDAF、UDTF

背景java 我根据算子输入输出之间的关系来理解算子分类:web UDF——输入一行,输出一行 UDAF——输入多行,输出一行 UDTF——输入一行,输出多行sql 本文主要是整理这三种自定义算子的具体实现方式 使用的数据集——用户行为日志user_log.csv,csv中自带首行列头信息,字段定义以下: 1. user_id | 买家id 2. item_id | 商品id 3. cat_id
相关文章
相关标签/搜索