神经网络基础——为什么要深层的网络

Fat+Short v.s. Tall+Thin 有人做了这样一个对比:在相同参数量的情况下,神经网络层数对最后模型结果的影响。 最后得出的结论为是:神经网络 Tall + Thin 的模型效果要好于Fat + Short 的效果。 为什么会出现这样的情况呢? 其实神经网络在设计过程中,其实是一个模块化的过程。 设想这样一个场景:现在需要做图像分类,标签为4类:长头发男生,短头发男生,长头发女生,
相关文章
相关标签/搜索