Hadoop生态圈简单介绍

Hadoop生态地图   网络浏览器:能够理解为海量数据源。java Nutch:一个开源Java 实现的搜索引擎。它提供了咱们运行本身的搜索引擎所需的所有工具。包括全文搜索和Web爬虫。算法 HDFS:分布式文件系统(Hadoop Distributed File System),设计有着为大数据处理“私人订制”的意思,提供高吞吐量的数据访问,很是适合大规模数据集上的应用。而且他是一个高度容错的
相关文章
相关标签/搜索