[生成对抗网络] 论文研读-SeqGAN: Sequence Generative Adversarial Nets with Policy Gradient

写在前面 GAN作为生成器已经在图像方面大放异彩,然而在NLP方面的应用还不多,原因一部分在于GAN是为连续空间设计的,而NLP是离散的,因此需要一点小小的trick才可以work,SeqGAN这一篇文章将RL作为鉴别器,用reward作为梯度来指导生成器的学习,算是一种option 原文地址 : https://arxiv.org/pdf/1609.05473.pdf 源代码 : https:/
相关文章
相关标签/搜索