Scikit learn Sample5—Imputing missing values before building an estimator

   在构建估算器之前输入缺失值      此示例显示,丢弃缺失值可以提供比丢弃包含任何缺失值的样本更好的结果。 输入并不总能改善预测,因此请通过交叉验证进行检查。 有时丢弃行或使用标记值更有效。     使用基本sklearn.impute.SimpleImputer可以将均值,中值或最常值替换为缺失值。 对于具有高幅度变量的数据,中值是更稳健的估计,其可以支配结果(否则称为“长尾”)。    
相关文章
相关标签/搜索