李飞飞计算机视觉笔记(4)--神经网络训练细节part1

这里说明一下,因为这个视频是2016年的,可能现在有些东西已经变化。 我们将用到以下和方差相关的定理: 假设有随机变量x和w,它们都服从均值为0,方差为σ的分布,且独立同分布,那么: • w*x就会服从均值为0,方差为σ*σ的分布 • w*x+w*x就会服从均值为0,方差为2*σ*σ的分布 是否我们应该需要大量的数据集对模型进行训练? 这种认识是错误的,我们一般很少直接对卷积神经网络进行训练,通常
相关文章
相关标签/搜索