李纪为:用于对话生成的深度强化学习

译者按:本文第一作者 Jiwei Li (李纪为) 是斯坦福的 Ph.D ,是一位在神经网络和 NLP 领域非常高产的作者。在之前发布的自然语言处理 2012-2016 年顶级会议作者统计中,他以 14 篇顶级会议论文第一作者的数据排名第一。本篇文章刚刚发布,是一篇探索性的文章,文章结合了目前主流的 sequence-to-sequence 模型和强化学习算法,在之前工作的基础上,利用一种 Alp
相关文章
相关标签/搜索