关于MapReduce(一)

MapReduce是一种可用于数据处理的编程模型。该模型比较简单,但是想写出有用的程序却不太容易。Hadoop可以运行Java、Ruby和Python等语言的MapReduce。最重要的是MapReduce本质上是并行运行的,因此可以将大规模的数据分析任务分发给任何一个拥有足够多机器的数据中心。MapReduce的优势在于处理大规模数据集,这里先使用广为流传的气象数据集作为例子来实现一个简单的de
相关文章
相关标签/搜索