数据酷客【深度学习:理论与应用】深度学习介绍

多层感知机(MLP) 多个神经元以全连接层次相连 前馈神经网络 万能逼近原理:非线性函数的有限次复合来无限接近目标函数 多层感知机:误差函数 模型的目标是让预测误差最小 一般使用梯度下降法(求导)来更新参数 链式法则计算梯度 后向传播计算梯度 MLP的困境 目标函数通常为非凸函数,不易求导获得最小值 极容易陷入局部最优值 网络层数增加后,链式法则计算梯度会出现梯度消失或爆炸问题 典型网络结构 卷积
相关文章
相关标签/搜索