Hadoop入门知识点

一、什么是Hadoop 是一个由Apache基金会所开发的分布式系统基础架构。 主要解决海量数据的存储和海量数据的分析计算问题。 广义上来说,Hadoop通常是指一个更广泛的概念——Hadoop生态圈。 二、Hadoop发展历史 Hadoop最早起源于Nutch。Nutch的设计目标是构建一个大型的全网搜索引擎,包括网页抓取、索引、查询等功能,但随着抓取网页数量的增加,遇到了严重的可扩展性问题——
相关文章
相关标签/搜索