如何理解数据科学的中的数据泄露(Data Leakage)

数据科学竞赛中有时会出现这样的奇特景观:某只队伍,靠着对极个别feature的充分利用,当即将对手超越,成功霸占冠军位置,并且与第二名的差距远超第二名与第十名的差距。然而,这些feature却不是在因果关系上顺利解释预测值的‘因’,反而是预测值的‘果’。安全 1. Data Leakage定义 存在和利用这种倒‘因’为‘果’的feature的现象,叫数据竞赛中的Data Leakage。网络 这里
相关文章
相关标签/搜索