TASK-2

nan是空缺值,统计空缺值的代码: Train_data.isnull().sum() 缺省值用填补:假设用0 X_data = X_data.fillna(0) 缺省值可视化的作用:可以很直观的了解哪些列存在 “nan”, 并可以把nan的个数打印,主要的目的在于 nan存在的个数是否真的很大,如果很小一般选择填充,如果使用lgb等树模型可以直接空缺,让树自己去优化,但如果nan存在的过多、可以
相关文章
相关标签/搜索