Hadoop是一个开源框架

一、Hadoop是一个开源框架,容许使用简单的编程模型在跨计算机集群的分布式环境中存储和处理大数据。     它的设计是从单个服务器扩展到数千个机器,每一个都提供本地计算和存储。 二、 硬件问题:复制数据解决(RAID) 分析须要从不一样的硬盘读取数据:MapReduce 而Hadoop提供了 1.可靠的共享存储(分布式存储) 2.抽象的分析接口(分布式分析) 三、关键技术 1.数据分布在多台机器
相关文章
相关标签/搜索