kaggle-EDA经验

要构建数值型连续变量的监督学习模型,最重要的方面之一就是好好理解特征。观察一个模型的部分依赖图有助于理解模型的输出是如何随着每个特征变化而改变的。 但是绘制的图形是基于训练好的模型构建的,这会引发一些问题。而如果我们直接用未经学习的学习的训练数据去作图,我们就能更好理解这些数据的深层含义。因为这样做能帮助我们进行: 特征理解 识别嘈杂特征 特征工程 特征重要性 特征调试 泄漏检测与理解 模型监控
相关文章
相关标签/搜索