batchsize的初步理解

谈到batchsize,必须引出多个样本的向量化问题 对于上图一个神经网络,假设有m条数据,如果采用非向量化的输入,就是一条一条的输入,伪代码如下: 其中z[1] (i)中的一表示神经网络第一层,i表示第i条样本数据。 向量化的输入数据X就是这种形式,m列表示m条样本。其实所谓的神经网络的连接,就是矩阵的乘法,这种计算方法在计算机中要比非向量化的每次输入单条数据的要快的多。 而batchsize就
相关文章
相关标签/搜索