Few-Shot Generalization Across Dialogue Tasks《少数据交互对话生成》

摘要 基于机器学习的对话管理器能够学习复杂的行为以完成任务,但是将其功能扩展到新领域并不容易。 我们研究了不同政策处理不合作用户行为的能力,以及在学习新的任务(例如预订酒店)时如何重新运用完成一项任务(例如餐厅预订)的专业知识。 我们介绍了循环嵌入对话策略(REDP),该策略将系统动作和对话状态嵌入同一向量空间。 REDP包含基于改进的神经图灵机的内存组件和注意力机制,并且在此任务上明显优于基准L
相关文章
相关标签/搜索