大数据技术学习笔记

大数据学习笔记 1、hadoop 2.0 项目结构 1 hdfs 分布式文件系统 2 yarn 资源调度系统 3 mapReduce 离线数据分析 4 Tez 组成有向无环图DAG计算 5 Spark 分布式内存计算 6 Hive 数据仓库,用Sql对数据进行统计分析 7 Pig 代替mapReduce进行简单的Sql语句,轻量级脚本语言 8,zookeeper 分布式协调服务 保证分布式系统的可
相关文章
相关标签/搜索