Andrew Ng's deeplearning Course2Week3 Hyperparameter tuning, Batch Normalization and Frameworks

一、超参数调试 1.超参数的选择次序 超参数的重要程度:1.α 2.β、hidden units、mini-batch size 3.layers、learning rate decay 4.β1、β2、ε(通常设为0.9,0.999,10^-8) 2.超参数的选取(随机取值,精确搜索) 假设我们的超参数1为学习率α,超参数2为ε,明显α的重要程度要大于ε,如果像上图左边的那样均匀选取,那可能只有
相关文章
相关标签/搜索