吴恩达DL lesson2 week3

3.1 调试处理(Tuning process) 关于训练深度最难的事情之一是你要处理的参数的数量 1学习速率α 2Momentum(动量梯度下降法)的参数β 3如果使用Adam 优化算法的参数β1,β2,ε,但是通常使用默认值:0.9,0.999,10−8 4mini-batch 的大小 5不同层中隐藏单元的数量 6层数 7学习率衰减率 常用超参数搜索 https://www.cnblogs.c
相关文章
相关标签/搜索