特征工程的步骤与理解

特征工程是在原有数据的特征下,通过想象力以及对数据的理解和一些特征组合形成新的特征,再对特征评估,优胜劣汰,取出能利用的特征提供给模型建模。 特征工程的常用手段: 1.通过箱型图: 文章中的数据特征比较多,特征看图就可。 通过箱型图,可以剔除某些特征,比如说,第一张图第三行的第二列,样本非常不均衡,说明该特征无意义,还要第二张图第一行第四列,该特征的数据对预测值没有参考意义,分布相同,没有区别。
相关文章
相关标签/搜索