动手深度学习(1)

(1)假如你正在实现一个全连接层,全连接层的输入形状是7×8,输出形状是7×1,其中7是批量大小,则权重参数ww和偏置参数bb的形状分别是8x1和1x1.。 (2) 课程中的损失函数定义为: def squared_loss(y_hat, y): return (y_hat - y.view(y_hat.size())) ** 2 / 2 将返回结果替换为下面的哪一个会导致会导致模型无法训练:(B
相关文章
相关标签/搜索