斯坦福CS224n NLP课程【五】——反向传播和项目建议

关于习题集1的提示:理解数学和高维向量 设置断点并输入各种参数  反向传播的第一种解释: 在上节课中,我们定义了这个目标函数 最终把它写成导数的形式 倒数写了两遍是为了说明不一定非要计算函数值 只要在前向传播中记录它的激活值 就可以了 所以把f(Wx+b)定义为隐含激活值然后就可以再次使用它来计算导数  再增加一层hidden 层 f()这里使用sigmoid函数 最大化s这个分数 通过这个内积来
相关文章
相关标签/搜索