google机器学习速成课程

时间 2019-12-07

原文原文链接

特征工程算法良好特征的特色：api 避免使用不多使用的离散特征值，良好的特征值应该出现5次以上最好具备清晰明确的含义不要将”神奇“的值域实际数据混为一谈，即不包含超出范围的异常值考虑上游不稳定，即特征的定义不随时间变化数据缩放：缓存 [min,max] (value-mean)/stddev 处理离群值：服务器取对数限制最大值分段或分箱数据清理：网络遗漏值重复样本不良标签

>>阅读原文<<