spark入门到精通(后续开始学习)

早几年国内外研究者和业界比较关注的是在 Hadoop 平台上的并行化算法设计。然而, HadoopMapReduce 平台因为网络和磁盘读写开销大,难以高效地实现须要大量迭代计算的机器学习并行化算法。随着 UC Berkeley AMPLab 推出的新一代大数据平台 Spark 系统的出现和逐步发展成熟,近年来国内外开始关注在 Spark 平台上如何实现各类机器学习和数据挖掘并行化算法设计。为了方便通常应用领域的数据分析人员使用所熟悉的 R 语言在 Spark 平台上完成数据分析,Spark 提供了一个称为 SparkR 的编程接口,使得通常应用领域的数据分析人员能够在 R 语言的环境里方便地使用 Spark 的并行化编程接口和强大计算能力。算法

特色:百度看编程

相关文章
相关标签/搜索