《Learning from Dialogue after Deployment:Feed Yourself, Chatbot!》阅读笔记——持续学习的对话系统

动机 •语料搜集困难,当前对话系统就是用人与人的语料来训练机器人,没有在人机对话时训练机器人网络 •人就是在对话中不断经过反馈来学习说话的学习 •直接利用人机的对话来学习可能致使错误传播,强化学习的思想是经过指标进行反馈,可是人在实际状况下是经过天然语言来进行反馈的编码 主要工做 •本文提出一个能够在机器人参与的对话中选取训练样本,他能够评估用户对它的回答的满意度,当对话顺利进行就能够将其做为新的
相关文章
相关标签/搜索