Hadoop,Spark,Hive的一些知识复习

Hadoop包括两个部分:分布式存储(HDFS)和分布式计算mr Spark与Hadoop最大的区别是mapreduce的job的中间输出结果能够保存在内存中,不须要读写HDFS,是基于内存的迭代计算框架,适用于须要屡次操做特定数据集的应用场合。 mapreduce做业运行机制java 经典的mapreduce(mapreduce1)node 客户端,提交mapreduce做业;jobtracke
相关文章
相关标签/搜索