一、大数据介绍

一、常见概念 HDFS-Hadoop分布式文件系统,GFS的java的开源实现,运行于大型商用机器集群,可实现分布式存储。 MapReduce-一种并行计算框架,Google Mapreduce 模型java开源的实现,基于其写出来的应用程序能够运行再有上千个商用机器组成的大型集群上,并以一种可靠容错的方式并行处理T级以上的数据集。 Zookeeper-分布式协调系统 Hbase-基于Hadoop
相关文章
相关标签/搜索