大数据之选择题大全(持续更新版)

1.当把挂载磁盘直接移除以后,打开系统以后会出现UUID找不到的状况下,会使用( B )命令才能修改/etc/fstab文件
A.mount -o remount,rw
B.mount -o remount,rw /
C.umount -o remount, rw /
D.mount -o umount,rw /

2.、查询yum源是否含有createrepo软件的安装包命令是( B )
A.rpm -qa |grep createrepo
B.yum list|grep createrepo
C.rpm -e createrepo
D.find / -name createrepo

3.ssh登陆中,配置通过受权的key的配置文件名称是( C )
A.id_rsa
B.id_rsa.pub
C.authorized_keys
D.known_hosts

4.查看当前目录全部文件和文件夹大小的命令是( C )
A.du -f
B.df -h
C.du -h
D.du -m

5.在awk中参数NR的意思是( B )
A.表示当前共有多少个字段
B.表明处理的是第几行
C.使用指定字符分割
D.获取当前行内容

6.在客户端读取hdfs文件的过程当中,当读完列表的 block 后,若文件读取尚未结束的状况下,保证读取 
DataNode 时无错误的状况下,客户端在整个读取hdfs数据的过程当中最少向NameNode请求几回是( B )
A.1
B.2
C.3
D.4

7.Hive参数配置方式优先级正确的是(  A )
A.参数声明>命令行参数>配置文件参数
B.参数声明>配置文件参数>命令行参数
C.配置文件参数>参数声明>命令行参数
D.命令行参数>参数声明>配置文件参数

8.在MapReduce的业务场景中,Combiner不能使用场景是( D )
A.sum求和
B.max求最大值
C.count求计数
D.avg求平均

9.在hive中,如下哪个说法是错误的( B )
A.当distribute by和sort by字段相同时,能够使用cluster by方式
B.distribute by的功能就是cluster by和sort by相结合
C.hive中指定了sort by,那么在每一个reducer端都会作排序,也就是说保证了局部有序
D.hive中的order by跟传统的sql语言中的order by做用是同样的,会对查询的结果作一次全局排序

10.在sort命令中去重操做的参数是( B )
A.-r
B.-u
C.-n
D.-t

11.动态显示运行中进程的信息是( C )
A.ps -aux
B.ps -ef
C.top
D.df -h

12.大数据分析项目的实现步骤是( B )
一、数据生产
二、数据预处理
三、结果数据展示
四、结果数据存储
五、数据存储
六、需求分析
七、数据采集
八、数据计算

A.1 7 8 6 5 2 4 3
B.1 7 5 6 2 8 4 3
C.1 5 6 8 7 2 4 3
D.1 5 8 4 7 2 6 3

13.建立一个软链接,目标文件是/home/test.txt,快捷方式路径是/test,是( D )
A.ln -s /test /home/test.txt
B.ls -n /test /home/test.txt
C.ln /home/test.txt /test
D.ln -s /home/test.txt /test

未完待续…