TensorFlow出现Found Inf or NaN global norm的排查和解决办法

在训练神经网络的时候,由于一些原因会出现NaN或者Inf,致使训练终止。在查阅相关资料之后,并且结合我出现的问题,做了一些总结。出现的代码在TensorFlow 1.12.2版本可正常执行。 出现问题的原因 出现NaN或者Inf的原因一般可分为以下三种 输入数据有错 出现了运算错误,如除数为零,log0等 梯度爆炸 输入数据有错 训练数据可能包含脏数据,在数据清洗时没有清洗干净,导致错误数据输入进
相关文章
相关标签/搜索