一文介绍特征工程里的卡方分箱,附代码实现

初次接触变量分箱是在作评分卡模型的时候,SAS软件里有一段宏能够直接进行连续变量的最优分箱,但若是搬到Python的话,又如何实现一样或者说相似的操做呢,今天就在这里简单介绍一个办法——卡方分箱算法。python 为了让你们更好理解这个算法,我先从基础的原理开始讲起。算法 1、什么是卡方分布 卡方分布(chi-square distribution, χ2-distribution)是几率统计里经
相关文章
相关标签/搜索