1.jps命令是来自哪里的
2.jps 发现不可用信息,咱们应该怎么办
3.pid文件默认存储哪里?哪一个文件修改
4.pid文件人为或Linux系统自动清理,那么会影响服务的正常运行吗? 那么又影响什么呢
5.面试题,hdfs的读写流程谁是output流,谁是input流
6.hadoop fs命令等价什么命令
7.hdfs上,上传下载咱们习惯用什么
8.hdfs dfs -ls / 这个根目录是指Linux根目录吗? /前面默认是否是还有一串地址?
9.假如让大家去官网找 hadoop三个组件的配置文件 网址,大家会不会
11.一个文件250M,块128M 两个副本,请问实际存储多少个块 存储空间多少
12.副本放置策略,第一块放置的策略是什么
13.简述SNN是干什么的
14.NN节点维护文件系统树,不会实际存储文件有哪些块,块分布哪些机器上。
那么是谁块报告给NN节点?
拓展题
生产上好比NN节点设置内存4G ,那么通常来讲NN节点能够维护75%的内存的文件树,说白了就是 存储文件名称。那么当小文件特别多,这样文件名称会特别多,对NN节点内存有压力,有可能会拖垮HDFS,因此生产上通常要小文件合并,什么叫小文件合并,好比:3个文件 都是10M的,文件名称字节加起来好比12个字节,那么合并一个大文件30M,文件名称就下降4字节,这样对NN节点压力就下降了面试