论文阅读笔记《A semi-supervised CNN based method for steel surface defect recognition》

核心思想

  本文提出一种半监督的钢铁表面缺陷检测方法(PLCNN),半监督的思路也比较常见,利用CNN对无标签样本进行预测,输出伪标签(Pseudo-Label),并将带有伪标签的样本作为训练样本对网络进行进一步训练。
在这里插入图片描述
  网络结构的设计也没有什么特别之处,唯一有点新意的地方可能就是损失函数的设计了。

实现过程

网络结构

  在这里插入图片描述

损失函数

  损失函数包含有标签损失和无标签损失两个部分,两个部分均采用交叉熵损失函数
在这里插入图片描述
在这里插入图片描述
其中最主要的就是平衡参数 α \alpha α的选择,训练前期伪标签样本并不可靠,所以 α \alpha α过大时就会导致无标签损失对结果影响较大,使得网络性能无法提高;如果 α \alpha α过小则会导致无标签样本对网络训练起不到作用。因此本文采用了一个分段线性增长的 α \alpha α选择策略,如下式
在这里插入图片描述
当训练周期数小于 T 1 T_1 T1时, α \alpha α置0,使得无标签损失不会对训练产生负面影响,只依赖有标签损失对网络进行训练;当训练周期数 T 1 < t < T 2 T_1<t<T_2 T1<t<T2时, α \alpha α随周期数线性增长,这是因为随着训练的进行,伪标签的准确性也在逐渐上升,所以稳定地增加无标签损失的作用;当训练周期数大于 T 2 T_2 T2时, α = α f \alpha=\alpha_f α=αf,无标签损失的作用被限定在一定的范围内,保证网络的训练效果。

创新点

  • 提出一种半监督学习的缺陷检测算法,设计了线性的平衡参数增长策略

算法评价

  中规中矩的一篇文章吧,但还是发表在了Q1区的顶刊里,文章写得比较规矩,思路并没有什么特别出彩的地方。

如果大家对于深度学习与计算机视觉领域感兴趣,希望获得更多的知识分享与最新的论文解读,欢迎关注我的个人公众号“深视”。在这里插入图片描述