基于MLlib的机器学习

1. 简介 MLlib 是Spark 中提供机器学习函数的库。它是专为在集群上并行运行的状况而设计的。MLlib 中包含许多机器学习算法,能够在Spark 支持的全部编程语言中使用,因为Spark基于内存计算模型的优点,很是适合机器学习中出现的屡次迭代,避免了操做磁盘和网络的性能损耗。Spark 官网展现的 MLlib 与Hadoop性能对比图就很是显著。因此Spark比Hadoop的MapRed
相关文章
相关标签/搜索