如何确保机器学习最重要的起始步骤"特征工程"的步骤一致性?

大家好,我是为人造的智能操碎了心的智能禅师。 关于特征工程,业界有这么一句话:数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限。 机器学习模型需要数据来训练,但是通常需要对这些数据进行预处理,以便在训练模型时发挥作用。这种预处理,也就是我们熟知的 “特征工程”,采用多种形式,例如:规范化和缩放数据,将分类值编码为数值,形成词汇表,以及连续数值的分级。 特征工程是指从原始数据转换为特征向
相关文章
相关标签/搜索