百面机器学习笔记之01特征工程

1特征归一化 主要分为两种数据类型:结构化数据(文本数据),非结构化数据(音视频数据即二进制数据) 1.1为什么需要对数值类型的特征做归一化? 为了将所有的特征都统一到一个大致相同的数值区间内。 在学习速率相同的情况下,x 1 的更新速度会大于x 2 ,需要较多的迭代才能找到最优解。如果将x 1 和x 2 归一化到相同的数值区间后,优化目标的等值图会变成图1.1(b)中的圆形,x 1 和x 2 的
相关文章
相关标签/搜索