深入理解spark之架构与原理

为什么80%的码农都做不了架构师?>>>     Spark提供了一个全面、统一的框架用于管理各种有着不同性质(文本数据、图表数据等)的数据集和数据源(批量数据或实时的流数据)的大数据处理的需求 官方资料介绍Spark可以将Hadoop集群中的应用在内存中的运行速度提升100倍,甚至能够将应用在磁盘上的运行速度提升10倍。 基本理念:      RDD(resillient distributed
相关文章
相关标签/搜索