Hadoop生态系统

Hadoop作为一个生态系统,每个系统只解决某一个特定的问题域(甚至可能很窄)。本文重点讨论分布式计算领域的几个开源系统可以解决的问题域。 (1)MapReduce:古老的分布式计算框架,它的特点是扩展性、容错性好,易于编程,适合 离线数据处理,不擅长流式处理、内存计算、交互式计算等领域。MapReduce网址是: http://hadoop.apache.org/ (2)Hive:披着SQL外衣
相关文章
相关标签/搜索