超参数调试、Batch归一化和程序框架

调试处理 不同的超参数,有不同的考虑优先等级,吴恩达的经验如下。 第一优先级的超参数:学习率 α α 。 第二优先级的超参数:Momentum的 β β ,神经网络每层的单元数(hidden units),mini-batch的子训练集大小(mini-batch size)。 第三优先级的超参数:神经网络的层数(layers),学习衰减率(learning rate decay) 第四优先集的超参
相关文章
相关标签/搜索