神经网络概念基础总结

1.使用softmax作为最终层输出。 计算每一个输出的比例,最大概率的作为最终预测的结果。 2、梯度下降 损失函数、、 J为定义的损失函数 分别求权重矩阵w和偏置值b的梯度(偏导数),梯度下降可能进入局部最优解 3、fat+short VS. Thin+tall 扁平或者深层对比 一般来说深层 好于扁平的网络 深层可以使用更多的特征进行分类,每一层一个特征 4、选择适当的的损失函数 Square
相关文章
相关标签/搜索