Hadoop笔记

Hadoop的概念 可拓展:可以由一台服务器拓展到数千台计算机,每台计算机都提供本地计算和存储 可靠的:不依靠硬件来提供高可用性,而是在应用检测和处理故障,从而在计算机集群上提供高可用服务 Hadoop能用来做什么 搭建大型数据仓库 PB级别的数据存储,处理,分析,统计业务 搜索引擎 日志分析 数据挖掘 商业智能(BI) Hadoop的发展史 2003-2004年Google发表了三篇论文 GFS
相关文章
相关标签/搜索