Spark SQL内置函数的使用Spark SQL执行计划总结

我的感受Spark SQL的优点在于UDF和DataFrame(RDD的封装,因为RDD是能够是任意类型,所以能够封装一个对象在RDD里面,spark2.0之后对DataSet作了优化,因为DataFrame是弱类型的判断,DataSet是静态类型的在数据的优化和性能上应该有更大的提高)sql 本文的操做spark 1.6.1apache 内置函数 须要倒入 importorg.apache.sp
相关文章
相关标签/搜索