李宏毅深度学习笔记

gradient descent :梯度下降 损失函数低,效果不一定好,为什么? 模型训练是根据损失函数调节w 和 b的,个人猜测原因是不是因为每次只能确保一个batch内的损失最小,但是整体就不一定了。 2.b 的作用只是将损失函数的线上移或者下移,没能改变损失函数的形状,那么b的作用是什么? 3.机器学习要知道它为什么能够识别出图片中的物体来。 4.可以自己去造数据 5.最好的做法是将数据集分
相关文章
相关标签/搜索