大数据学习之Hadoop如何高效处理大数据

Hadoop与Google同样,都是小孩命名的,是一个虚构的名字,没有特别的含义。从计算机专业的角度看,Hadoop是一个分布式系统基础架构,由Apache基金会开发。Hadoop的主要目标是对分布式环境下的“大数据”以一种可靠、高效、可伸缩的方式处理。设想一个场景,假如您须要grep一个100TB的大数据文件,按照传统的方式,会花费很长时间,而这正是Hadoop所须要考虑的效率问题。大数据学习群
相关文章
相关标签/搜索