Spark核心编程-RDD概述

说明:本文参考郭景瞻的《图解Spark:核心技术与案例实战》算法 1、背景 一、缘由 计算机广泛应用和移动互联网的发展致使了数据量爆发式增加,单台机器处理能力和I/O性能远远知足不了这种增加,愈来愈多的企业不得不把计算和存储扩展到集群中去。可是在集群中又出现了如下的三个问题:数据库 (1)并行化处理:之前的应用程序须要以并行化的方式重写,而且这种编程模型可以处理范围普遍的计算。编程 (2)集群的容
相关文章
相关标签/搜索