初识Hadoop(1)

一些基本问题: 1 避免数据丢失的常见做法是复制:通过系统保存数据的冗余副本,在故障发生时,可以使用数据的另一个副本,这就是冗余磁盘阵列的工作方式。 Hadoop的文件系统HDFS(Hadoop Distributed Filesystem) 2 大部分分析任务需要通过某种方式把数据合并起来。MapReduce提供一个编程模型,其抽象出磁盘读写的问题,将其转换为计算一个由成对键值组成的数据集。这个
相关文章
相关标签/搜索