学习笔记-batch normalization

这是Deep learning 第二门课的第三周课程的学习笔记。 1. Hyperparameter tuning 针对深度学习,不推荐使用grid search来寻找最优的参数值。因为深度学习的计算量实在太大了,grid search方法太耗资源也太慢了。 对于深度学习的调参,吴老师的观点是: -Try random values, do not use a grid; -Coarse to f
相关文章
相关标签/搜索