Hadoop面试题总结

Hadoop面试题总结 1. hadoop的TextInputFormat做用是什么?如何自定义实现? InputFormat会在map操做以前对数据进行两方面的预处理:java gitSplits,返回的是InputSplit数组,对数据进行split切片,每个切片都须要一个map任务去处理。 getRecordReader,返回的是RecordReader对象,将每一个切片中的数据转换为<k,
相关文章
相关标签/搜索