一文读懂Hadoop、HBase、Hive、Spark分布式系统架构

来源:http://developer.51cto.com/art/201609/516716.htm 机器学习、数据挖掘等各种大数据处理都离不开各种开源分布式系统,hadoop用户分布式存储和map-reduce计算,spark用于分布式机器学习,hive是分布式数据库,hbase是分布式kv系统,看似互不相关的他们却都是基于相同的hdfs存储和yarn资源管理,本文通过全套部署方法来让大家深入
相关文章
相关标签/搜索