Cross-Platform Resource Scheduling for Spark and MapReduce on YARN论文理解

Cross-Platform Resource Scheduling for Spark and MapReduce on YARN论文理解 摘要 MapReduce不能有效的处理大数据的非批处理过程(例:交互式作业,实时查询和流计算);新兴的Apache Spark则可以处理这一过程,Spark可以在已建立的Hadoop集群上运行并利用现有的HDFS。 在YARN上部署Spark的三个主要挑战
相关文章
相关标签/搜索