基于大数据分析系统Hadoop的13个开源工具

Hadoop是由Apache基金会开发的一个大数据分布式系统基础架构,最先版本是2003年原Yahoo!DougCutting根据Google发布的学术论文研究而来。用户能够在不了解分布式底层细节的状况下,轻松地在Hadoop上开发和运行处理海量数据的应用程序。低成本、高可靠、高扩展、高有效、高容错等特性让Hadoop成为最流行的大数据分析系统,然而其赖以生存的HDFS和MapReduce组件却让
相关文章
相关标签/搜索