1.1.谈谈如何理解shuffle
2.简述 mr提交到yarn的工做流程
3.yarn哪两个进程
4.yarn的资源调优参数,是否会配置?
5.谈谈你对jps命令 pid生成在哪一个目录
6.谈谈大家对pid的理解
7.hdfs读流程是output吗
8.一个文件160M,64M的块大小,三个副本,请问块多少,实际存储多少
9.pid文件人为删除,会影响服务正常运行吗?那么会影响什么?
10.hdfs dfs等价于什么命令
11.默认的hdfs,yarnweb的端口号多少
12.假如让大家修改默认的端口号,大家想一想会不会去官网网站的默认配置文件找呢???
13.hdfs和yarn进程的内存大小 在哪一个文件配置
14.谈谈什么是数据本地化
15.假如NN节点进入安全模式,大家应该以为怎么作
16.副本放置策略,假如提交的DN节点,那么第一个副本存哪里
17.hadoop家目录里,怎样找到example jar包
18.大家以为 命令帮助怎么看?
web