Hadoop中的发展历史

Hadoop使用分布式文件HDFS系统,用于存储大数据(数据至少要到TB吧)。版本1的时候,使用MapReduce来作计算处理。版本2的时候,使用yarn来作计算处理。可是这两个版本都是使用磁盘空间做为计算。版本3的时候,Hadoop支持Spark来计算处理。Spark即支持磁盘作数据处理,也支持内存来作数据处理。Spark支持Python,JAVA,Scala语言。框架 MapReduce、ya
相关文章
相关标签/搜索