大数据面试题整理 --持续更新中

Hadoop 常见面试题 1.mr 工做原理 mr 将获得的split 分配对应的 task,每一个任务处理相对应的 split,将 split 以 line 方式读取每一行数据,将数据依次读取到100M(maprdeuce.task.io.sort.mb)的环形缓冲区读取过程当中一旦到达阈值(mapreduce.map.sort.spill.percent)80M进行溢写操做,spiller线程
相关文章
相关标签/搜索