Hadoop架构简介

Google大数据技术:MapReduce、BigTable、GFS,Google只发布了相关的技术论文,没有开源。Hadoop是一个模仿谷歌大数据技术的开源实现。Hadoop是一个开源的分布式存储+分布式计算的平台。包括两个核心:HDFS(分布式文件系统,存储海量数据)和MapReduce(并行处理框架,实现任务的分解和调度) HDFS的文件被分成块(Block)进行存储,块的默认大小是64MB
相关文章
相关标签/搜索