CS231N-Lecture6 Training Neural Network part-2

时间 2020-12-24

原文原文链接

一、概述这一集讲了一些列不同的梯度下降算法，做了一些比较。之后，讲到了Dropout机制，随机关闭一些neuron的训练方式可以使整个模型更加有效。然后讲到了一点关于Model Ensemble的技巧。最后，做了一个Convnet的引入，介绍了Convnet的历史起源，以及后人的一些成就。二、梯度下降算法 SGD SGD(Stochastic Gradient Descent)就是之前一