大数据框架学习:从 Hadoop 到 Spark

Hadoop   1. Hadoop是什么   Hadoop软件库是一个利用简单的编程模型在大量计算机集群上对大型数据集进行分布式处理的框架。   特点:部署成本低、扩展方便、编程模型简单。   Hadoop 实现了在行业标准的服务器上进行可靠、可缩放的分布式计算,让你能够以较低的预算跟踪数 PB 以上的数据,而不必需要超级计算机和其他昂贵的专门硬件。   Hadoop 还能够从单台服务器扩展到数
相关文章
相关标签/搜索