《Spark 最佳实践》阅读笔记

《Spark 最佳实践》阅读笔记 此文为Up阅读《Spark 最佳实践》的过程所记的笔记。web Hadoop生态系统 Hadoop是谷歌大数据解决方案的开源实现,使用Java语言开发,其核心内容主要是两部分:分布式文件系统(HDFS)和MapReduce。数据库 Hive 是HDFS和MapReduce上提供一个相似于SQL风格的抽象层,很是容易上手。 HBase 是基于Hadoop的非关系型数
相关文章
相关标签/搜索