sphereface 训练出现的问题

训练了64 层卷积的模型,没有训出来作者paper 上发布的结果。现在训练最好的结果是十重校验的平均是99.30 %  paper 上报告的精度是99.42% 差的比较多。 训练了ms 的sphereface20 层的模型。迭代了2W次loss 没有下降,我现在的想法是 500W 的数据除以batchsize 128 那么可能所有的数据,都认识一遍才能收敛。2W次loss 不下降应该是正常的现象,
相关文章
相关标签/搜索