hiveQL 聚合函数

count(*): 计算总行数
count(expr): 计算提供的expr表达式的值非NULL的行数
distinct: 排重
sum(col): 计算指定行的值的和
sum(DISTINCT col): 计算排重后值的和
avg(col): 计算指定行的平均值
avg(DISTINCT col): 计算排重后的指定行的平均值
min(col): 计算指定行的最小值
max(col): 计算指定行的最大值
variance(col): 计算集合col中的一组数值的方差
var_samp(col): 返回集合col中的一组数值的样本方差
stddev_pop(col): 返回一组数值的标准方差
covar_pop(col): 返回一组数值的协方差
covar_samp(col): 返回一组数值的样本协方差
corr(col1, col2): 返回两组数值的相关系数
percentile(BIGINT T, int_expr,p): int_expr 在p处对应的百分比
collect_set: 返回集合col元素排重后的数组web