训练神经网络的常见错误

本文内容来自Andrej Karpathy, 李飞飞的高足。 twitter截图如下: 下面来逐点说明。受小博主知识上界限制,文中不免有理解不正确之处,恭请批评指正。 1、you didn’t try to overfit a single batch first. 首先尝试用小数据集作为一个batch,奔着过拟合去,短时间内排除明显的错误。 2、you forgot to toggle trai
相关文章
相关标签/搜索