IV WOE & 评分卡 & 分箱

  数据分箱:对连续变量离散化;实际上就是按照属性值划分的子区间,可以简单理解为分段处理(不同的是对特征进行分箱后,需要对分箱的每组进行woe编码进行分箱评估,才能放进模型训练); 意义:     1.模型更稳定,特征离散化后,起到简化逻辑回归模型的作用,降低过拟合风险;     2.变量离散化后对异常数据有很强的鲁棒性;     3.将逻辑回归模型转换为评分卡形式的时候,分箱也是必须的; 分组原
相关文章
相关标签/搜索