Google机器学习课程笔记(2)

training and test sets   降低过拟合的发生:分成三个子集   验证集评估训练集的效果,通过后再使用测试集评估检查   特征工程:原始数据---》特征矢量   缩放特征值(转换为标准范围(0,1),(-1,1)) 处理极端离群值: 取对数 最大值限制(伪影)   分箱:分成多个不同的布尔值特征   特征组合: 组合独热矢量 线性学习器可以很好地扩展到大量数据。对大规模数据集使
相关文章
相关标签/搜索