第1章 大数据Spark概述

Spark概述 1.1、什么是Spark MR的缺点: mr基于数据集计算,所以面向数据 (1)基本运算规则从存储介质中获取(采集)数据,然后进行计算,最后将结果存储到介质中,所以主要应用于一次计算,不适合于数据挖掘和机器学习的迭代计算和图形挖掘计算。 (2)MR基于文件存储介质的操作,所以性能非常慢。 (3)MR和hadoop紧密耦合在一起,无法动态替换 Spark的历史 (1)2013年6月发
相关文章
相关标签/搜索