深度学习:欠拟合问题的几种解决方案

我最近作深度学习在连续中文语音识别方向的应用的时候,根据一些论文和网上一些公开代码和模型结构,设计了一个神经网络的模型。可是在训练的时候,就首先遇到了很让人头疼的欠拟合问题。神经网络欠拟合的特征是,训练了很长时间,可是在训练集上,loss值仍然很大甚至与初始值没有太大区别,并且精确度也很低,几乎接近于0,在测试集上亦如此。且先无论模型结构配置的优劣,就欠拟合问题来讲,须要从以下方面来着手。html
相关文章
相关标签/搜索