二分类比赛流程

数据预处理 确认数据是否完整(nan,类型异常) 将string类型,换成category(使用Onehot或者LabelEncoder) 数据标准化(MirmaxScaler或者StandardScaler) 保存数据(由于部分预处理过程会比较耗时,因此须要保留中间结果) 模型选择 通常来讲,越新的模型效果越好 模型 - 示例 lightgbm 随机切分验证集,构建lgb的dataset:上采样
相关文章
相关标签/搜索