weka中对数值型数据离散化

连续数值离散化大体可分为:1)有监督(supervised)和2)无监督(unsupervised)两类。 有监督方法可经过设定类别相关目标函数如:分类错误率,熵增益等指标结合二叉树算法对特征空间进行划分。这类方法的核心思想就是是每类样本尽可能分布在特征空间中的不一样子划分中。  无监督方法因为没有考虑类别信息,所以其核心思想是使得每一个子划分空间的样本分布尽可能均匀,具体能够采用等间隔、等密度或
相关文章
相关标签/搜索