五年经验大佬带你掌握 基于Hadoop与Spark的大数据开发实战

前言: 本书以Hadoop和Spark为核心,阐述了基于这两种通用大数据处理平台的应用开发技术。 在Hadoop生态圈中,从HDFS初识分布式存储系统;以MapReduce详解f分布式计算的步骤;利用HBase分析适合非结构化数据存储的分布式数据库;利用Hive分析将SQL查询转化为分布式计算的过程;并结合项目案例“音乐排行榜”练习Hadoop核心技能点的运用;同时,介绍了几种离线处理系统中常用的
相关文章
相关标签/搜索