Hadoop入门之安装配置(hadoop-0.20.2)

Hadoop入门之安装配置(hadoop-0.20.2)       Hadoop,简单理解为HDFS(分布式存储)+Mapreduce(分布式处理),专为离线和大规模数据分析而设计。       Hadoop可以把很多linux的廉价PC组成分布式结点,然后编程人员也不需要知道分布式算法之类的,只需根据mapreduce的规则定义好的接口方法,剩下的就交给hadoop,它会自动把相关的计算分布到
相关文章
相关标签/搜索