Hadoop简介及安装

简介 Hadoop是Apache的顶级项目,是一个可靠的、可扩展的、分布式计算的开源项目。 创始人:Doug Cutting 和Mike Hadoop起源: 2004年Doug Cutting和Mike Cafarella在设计搜索引擎Nutch的时候 ,利用通用爬虫爬取了互联网上的数据,获取了大概10亿个网页数据 ,因为互联网的数据大多数是非结构化的,就意味着这些数据无法存储到数据库中。为了解决
相关文章
相关标签/搜索