pyspark之MLlib学习【加载和转换数据】(1)

pyspark系列文章是本人根据《PySpark实战指南》学习pyspark中学习笔记,这本书是一本译文,有些地方感觉有点小问题,不过在本人的这些笔记中都是亲自测试跑通后的小例子。仅作参考和学习。 1.概述 MLlib概括了单个核心机器学习功能: 数据准备:特征提取、变换、选择、分类特征的散列和一些自然语言处理方法。 机器学习算法:实现了一些流行和高级的回归,分类和聚类算法。 使用程序:统计方法,
相关文章
相关标签/搜索