《大数据工程师(运维)面试系列(4)》

1.MapReduce解决缺值问题? 一张很是宽,且数据量大的表,被分割成若干个hdfs上的小文件,其中有一个字段,是自增的(但分布的文件中的这个字段值是乱序的),举个栗子,好比:1,2,3。如今并不知道到底是哪几个值缺失,请你用MapReduce的方式将那些缺失的值找到?html 其实这是MapReduce的典型应用场景之一——缺值查找。总体的一个思路是,先将这些乱序的值排好序,而后又由于表很是
相关文章
相关标签/搜索