《Meta Dialogue Policy Learning》Meta-DTQN (DP + RL) 上

《Meta Dialogue Policy Learning》 作者:微软2020 介绍: 研究任务型对话中DP组件的few shot问题与新领域迁移。 提出了DTQN以利用跨domains的low-level共享信号(如动作、槽位)。 把DTQN嵌入到一个meta-Learning框架,引入了Meta-DTQN。 注意现在这个论文还在under review,所以源码就别想了,不过可以去Conv
相关文章
相关标签/搜索