大数据面试题

1.列举spark 比hadoop 快的原 因 ,以及如今存在的主要问题 2.描述下使用spark streaming 和 GraphX实现实时计算的可行性,以及可能会遇到的问题 3.GraphX的Pregel API 只支持有向图遍历  ,如何实现无xiang 遍历,描述思路 4.SPark 经过yarn 提交任务时,yarn-client & yarn-cluster 的区别 5.Spark
相关文章
相关标签/搜索