一文介绍特征工程里的卡方分箱,附代码实现

初次接触变量分箱是在做评分卡模型的时候,SAS软件里有一段宏可以直接进行连续变量的最优分箱,但如果搬到Python的话,又如何实现同样或者说类似的操作呢,今天就在这里简单介绍一个办法——卡方分箱算法。 为了让大家更好理解这个算法,我先从基础的原理开始讲起。 一、什么是卡方分布 卡方分布(chi-square distribution, χ2-distribution)是概率统计里常用的一种概率分布
相关文章
相关标签/搜索