JavaSpark-编程进阶-数值RDD管道基于分区操做

数值RDD的操做 Spark对包含数值数据的RDD提供了一些描述性的统计操做 Spark的数值操做是经过流式算法实现的,容许每次一个元素的方式构建模型。这些统计数据都会在调用stats()时经过一次遍历数据计算出来,并以StatsCounter对象返回 count() mean():平均数 sum() max() min() variance():方差 sampleVariance():采样中计算
相关文章
相关标签/搜索