一、HDFS的优势node
(1)适合批处理内存
(2)适合处理大量的数据扩展
(3)可构建在廉价的机器上map
二、HDFS的缺点数据
(1)低延迟的数据访问文件存储
(2)小文件存储不适合,由于每一个文件的元信息都要储存在namenode中,而namenode内存有限文件
(3)不适合流式计算和实时处理
三、什么是mapreduce
起源:源自Google的mapReduce论文
特色:(1)良好的扩展性
(2)高容错性
(3)适合海量数据的离线处理