Hadoop MapReduce任务的执行过程

注:本文注重原理介绍,较少涉及编程实现,有错误请指正,感谢~web 在进入正文以前须要了解这几个概念:编程 HDFS:能够先简单理解为它是一个大型分布式的文件系统,里面存放了大量文件,也能够理解为放着俗称的大数据。网络 数据块:HDFS中的数据以数据块为单位存放,默认是64MB,HDFS中的文件可能远远大于64MB,它被分割成不少个数据块,存放在集群上,数据块不必定存放在一台机器上,也不必定是连续
相关文章
相关标签/搜索