SparkMLlib随机森林实现pm预测(自定义函数的使用)

本文主要是用SparkMLlib中的一些算法来对PM进行预测,其中涉及了dataframe中对列使用自定义函数的操做,很方便!! 任务:读取pm.csv,将含有缺失值的行扔掉(或用均值填充)将数据集分为两部分,0.8比例做为训练集,0.2比例做为测试集 (1)使用month,day,hour,DEWP,TEMP,PRES,cbwd,Iws,Is,Ir做为特征列(除去No,year,pm),pm做为
相关文章
相关标签/搜索