spark特征工程处理流程

1、特征工程 查看数据的分布 1df.describe().show() 2df.summary().show() //这个显示比describe更全 1 惟一值删除 移除列特征中只有一个值的列web 1 2`def UniqueValueRemove(df:DataFrame)={ 3 4 val df_ttmp=df.select(df.columns.map(c=>countDi
相关文章
相关标签/搜索