知道创宇大数据面试题

知道创宇   (1)为啥用rdd不用DF或者是DS (2)sparkstreaming窗口函数处理数据时,如果我处理近一个小时的数据,但是出现上一个小时数据如何处理 (3)sparkstreaming处理数据时,出现kafka消费数据延迟,出现上一个小时数据,如何处理 (4)scala和java相比开发spark的优点 (5)你对隐式函数的了解,能看懂隐式函数吗? (6)如何实现topn (7)如
相关文章
相关标签/搜索