DL的小Trick

文章目录 1 术语 1.1 泛化能力(generalization) 1.2 [:3]这个array的index表示取array的前三个 2 动量(惯性, 前一个梯度的惯性)(前一个梯度和当前梯度进行平行四边形3333) 3 learning rate(刚开始设置大一些, 之后再搞的小一些) 1 术语 1.1 泛化能力(generalization) 从这个模型, 推广到其他模型 如果这个网络的参
相关文章
相关标签/搜索