如何理解推荐系统离线和线上auc和线上点击率不一致的问题?

目录 1. 特征/数据出现穿越 2. 线上线下特征不一致 3. 数据分布的不一致 离线指标和线上指标不一致是个常见的问题,花了很大力气好不容易离线auc涨了不少,上线一看效果ctr和cpm反而下降。本文例举几种可能的原因和解决办法。 1. 特征/数据出现穿越 一般就是使用了和label强相关的特征导致的数据泄漏。这种问题一般相对好查,很多时候在离线阶段就能发现。明显的表现就是训练集和测试集差异比较
相关文章
相关标签/搜索