Hadoop完全分布式部署

一、概述 概念: 是一个可靠的、可伸缩的、分布式计算的开源软件。 是一个框架,允许跨越计算机集群的大数据及分布式处理,使用简单的编程模型(mapreduce) 可从单台服务器扩展至几千台主机,每个节点提供了计算和存储功能。 不依赖于硬件处理HA,在应用层面实现 特性4V: volumn 体量大 velocity 速度快 variaty 样式多 value 价值密度低 模块: hadoop comm
相关文章
相关标签/搜索