如何通过分类数据执行特征选择?

作者 | Jason Brownlee 编译 | CDA数据分析师 特征选择是识别和选择与目标变量最相关的输入特征子集的过程。 使用实值数据(例如使用Pearson的相关系数)时,特征选择通常很简单,但是使用分类数据时可能会遇到挑战。 当目标变量也是分类的(例如分类预测建模)时,分类输入数据的两种最常用的特征选择方法是卡方统计和互信息统计。 在本教程中,您将发现如何使用分类输入数据执行特征选择。
相关文章
相关标签/搜索