大数据面试题一

第1题:spark代码运行流程: 第二题:HDFS 文件写入过程: 第三题:shuffle的sort,partition,group:   第四题:zookeeper选举机制和集群的搭建: 第五题:sparkStreaming在实时处理会发生什么故障如何解决: 第六题:大数据离线遇到什么问题怎么处理的:     1.除了MySQL和oracle,在线数据库还有其他选择吗? 实际上,目前,首选通常是
相关文章
相关标签/搜索