自然语言处理(二)

神经序列模型: 机器学习: 优化目标函数:初始化参数、计算偏导数、更新参数、更新learning rate,直至收敛 Batch Gradient Descent 梯度下降法: 稳定可靠,更新速度慢。必须遍历所有的训练数据求偏导数,才能更新一次参数。 Stochastic Gradient Descent 梯度下降法: 不稳定,更新快。每看见一个数据点就更新,非常不稳定。 Mini-batch G
相关文章
相关标签/搜索