白话总结《特征工程之连续变离散》

主要参考博客:http://www.sohu.com/a/211388625_670669 目前业务所用模型都需要把连续的特征转化为离散值,特做总结如下: 1. Bucket 分桶: 把范围较广的连续值分桶 分桶的个数一般由特征意义和经验人为设定,比如年龄可以根据小学,初中,高中,大学等分桶, 此处以日期举例: 优势: 连续性特征拆分成一个四元素向量,那么模型现在可以学习四个单独的权重,与单个权重
相关文章
相关标签/搜索