Self-critical Sequence Training for Image Captioning

Self-critical Sequence Training for Image Captioning 原文地址 时间:2017 Intro 近年来策略梯度(policy-gradient)在训练深度端到端系统上展现了它的能力,它可以以不可导的度量作为目标函数,本文考虑的问题就是使用强化学习来训练image captioning模型,称为self-critical sequence traini
相关文章
相关标签/搜索