SparkSQL的两种UDAF的讲解

Spark的dataframe提供了通用的聚合方法,好比count(),countDistinct(),avg(),max(),min()等等。然而这些函数是针对dataframe设计的,固然sparksql也有类型安全的版本,java和scala语言接口都有,这些就适用于强类型Datasets。本文主要是讲解spark提供的两种聚合函数接口:java 1, UserDefinedAggregat
相关文章
相关标签/搜索