1.hdfs 伪分布式哪三个进程,简写
2.yarn伪分布式哪两个进程,简写
3.简述 nn作什么的?
4.简述 snn是作什么的那幅图,是否可以描述清楚?
5.一个文件130M,block设为128M,系统设置3副本,请问多少块,多少存储
6.拓展题: 因此,假如都是5M 10M 20M这些小文件,咱们是否是为了不nn节点内存的压力,要不合并这些小文件,要不就将冷数据迁移到好比oss,s3存储上
7.假如让你找配置参数,你会在官网找吗
8.简述大家对shuffle的理解
9.简述什么是数据本地化
10.简述mr提交到yarn上
11.hive数据分为 元数据和数据,那么大家课程中,分别存储在哪里分布式