Hadoop入门学习随笔

===Hadoop是什么? 开源的、分布式存储+分布式计算平台。 http://hadoop.apache.org   ===Hadoop的组成 包括两个核心组成: HDFS:分布式文件系统,存储海量的数据 MapReduce:并行处理框架,实现任务分解和调度   ===Hadoop可以用来做什么? 搭建大型数据仓库,PB级数据的存储、处理、分析、统计等业务。   ===Hadoop的优势: 高扩
相关文章
相关标签/搜索