微软、阿里、百度、腾讯都在使用的Spark大数据分析实战

Spark作为一款基于内存的分布式计算框架,具有简洁的接口,可以快速构建上层数据分析算法,同时具有很好的兼容性,能够结合其他开源数据分析系统构建数据分析应用或者产品。 为了适合读者阅读和掌握知识结构,本篇从Spark基本概念和机制介绍人手,结合笔者实践经验讲解如何在Spark之上构建机器学习算法,并最后结合不同的应用场景构建数据分析应用。 读者对象 本篇中一些实操和应用章节,比较适数据分析和开发人
相关文章
相关标签/搜索