大数据处理之hadoop,spark

hadoop包括大数据的存储和查询,用SQL查询 spark是一种新型的计算大数据的框架。用spark可以替代hadoop的一部分查询功能。 spark主要用于大数据的计算,hadoop主要用于大数据的存储。 hadoop hdfs:hadoop分布式文件系统。 map/reduce:计算框架,基于它写出来的应用程序能够运行在大型集群上 zookeeper:高可用和可靠的分布式协同系统。 hive
相关文章
相关标签/搜索