如何将pyspark的rdd数据类型转化为DataFrame

简述   在用pyspark进行开发的时候,常常会遇到如何将pyspark读取的数据使用xgboost的模型进行训练,固然,若是是使用scala,能够直接使用xgboost4j,这个库里面提供了能够读取rdd的数据文件的函数接口,经过scala能够很简单的进行训练,可是对于python用户来讲,如何使用pyspark和xgboost进行训练,就比较难以处理了?   本人经过对libsvm的数据进行
相关文章
相关标签/搜索