十小时入门大数据学习笔记(二)

第二章 初识Hadoop 2.1Hadoop概述 名称由来:项目作者的孩子对黄色大象玩具的命名 开源、分布式存储与分布式计算的平台   Hadoop能做什么: 1. 搭建大型数据仓库,PB级数据的存储、处理、分析、统计等业务 2. 搜索引擎、日志分析、数据挖掘、商业智能   2.2Hadoop核心组件 HDFS(分布式文件系统) 1. 源于Google在2003年10月发表的GFS论文 2. 对G
相关文章
相关标签/搜索