spark 基于MLlib的机器学习 Spark MLlib

MLlib是Spark中提供机器学习学习函数的库。它是专为在集群上并行运行的情况而设计的。 MLlib的设计理念十分简单:把数据以RDD的形式表示,然后在分布式数据集上调用各种算法。MLlib引入了一些数据类型(比如点和向量),不过归根结底,MLlib就是RDD一系列可供调用的的函数的集合。 MLlib由一些通用的学习算法和工具组成,包括分类、回归、聚类、协同过滤、降维等,同时还包括底层的优化原语
相关文章
相关标签/搜索