最核心的特征工程方法-分箱算法

分箱算法简介 先来说讲什么是分箱算法,根据字面意思就是把数据按照不一样的规则分到不一样的箱子里。其实分箱是特征工程的一种,能够理解为一种连续数据变为离散数据的建模方式。算法   举个直观的例子,好比有一组连续数据,好比为25,14,68,43,63。假设数据的分箱逻辑是大于50为0,小于50为1,那么最终数据会变成1,1,0,1,0,数据就离散化了。固然分箱有不少方式,大体做用就是把连续数据按照必
相关文章
相关标签/搜索