Hadoop进阶

hadoop模仿谷歌大数据技术,开源。 Hadoop 开源的,分布式存储+分布式计算平台 两个核心组成: HDFS:分布式文件系统,存储海量的数据 MapReduce: 并行处理框架,实现任务分解和调度 可以用来做什么? 搭建大型数据仓库,PB级数据的存储、处理、分析、统计等业务。 优势: 高扩展 低成本 成熟的生态圈 应用情况 百度,腾讯,阿里都在用 生态系统 HIVE, habse和hdfs区
相关文章
相关标签/搜索