分分钟带你杀入Kaggle Top 1%

不知道你有没有这样的感觉,在刚刚入门机器学习的时候,咱们通常都是从MNIST、CIFAR-10这一类知名公开数据集开始快速上手,复现别人的结果,但总以为过于简单,给人的感受太不真实。由于这些数据太“完美”了(干净的输入,均衡的类别,分布基本一致的测试集,还有大量现成的参考模型),要成为真正的数据科学家,光在这些数据集上跑模型倒是远远不够的。而现实中你几乎不可能遇到这样的数据(现实数据每每有着残缺的
相关文章
相关标签/搜索