分布式计算框架

                                      分布式计算框架 Hadoop是基础,其中的HDFS提供文件存储,Yarn进行资源管理。在这上面可以运行MapReduce、Spark、Tez等计算框架。 MapReduce:是一种离线计算框架,将一个算法抽象成Map和Reduce两个阶段进行处理,非常适合数据密集型计算。 Spark:Spark是UC Berkeley A
相关文章
相关标签/搜索