RDD转换成DataFrame的两种方式

1、概述 Spark SQL支持两种不一样的方式将RDD转换为DataFrame。第一种是使用反射来推断包含特定类型对象的RDD的模式,这种基于反射的方式能够提供更简洁的代码,若是在编写Spark应用程序时,已经明确了schema,能够使用这种方式。第二种方式是经过可编程接口来构建schema,而后将其应用于现有的RDD。此方式编写的代码更冗长,但在不知道colum及其type的状况下,能够使用这
相关文章
相关标签/搜索