吴恩达《深度学习》第二门课（3）超参数调试、Batch正则化和程序框架

时间 2020-12-22

原文原文链接

3.1调试处理（1）不同超参数调试的优先级是不一样的，如下图中的一些超参数，首先最重要的应该是学习率α（红色圈出），然后是Momentum算法的β、隐藏层单元数、mini-batch size（黄色圈出）、再之后是Layer、learning rate decay（紫色圈出）、最后是Adam算法中的β1、β2、ε。（2）用随机取值代替网格点取值。下图左边是网格点取值，如果二维参数中，一个参数调

>>阅读原文<<