强化学习在生成对抗网络文本生成中扮演的角色(Role of RL in Text Generation by GAN)(下)...

5. 一些细节 + 一些延伸 上文所述的,只是 RL + GAN 进行文本生成的基本原理,大家知道,GAN在实际运行过程中任然存在诸多不确定因素,为了尽可能优化 GAN 文本生成的效果,而后发掘更多GAN在NLP领域的潜力,还有一些值得一提的细节。 5.1. Reward Baseline:奖励值上的 Bias 在4.2节中提到,我们采用鉴别器D给予生成样本  的概率得分(  属于真实样本的概率)
相关文章
相关标签/搜索