《Learning from Dialogue after Deployment:Feed Yourself, Chatbot!》阅读笔记——持续学习的对话系统

时间 2020-01-22

标签 learning dialogue deployment feed chatbot 阅读笔记持续学习对话系统繁體版

原文原文链接

动机 •语料搜集困难，当前对话系统就是用人与人的语料来训练机器人，没有在人机对话时训练机器人网络 •人就是在对话中不断经过反馈来学习说话的学习 •直接利用人机的对话来学习可能致使错误传播，强化学习的思想是经过指标进行反馈，可是人在实际状况下是经过天然语言来进行反馈的编码主要工做 •本文提出一个能够在机器人参与的对话中选取训练样本，他能够评估用户对它的回答的满意度，当对话顺利进行就能够将其做为新的

>>阅读原文<<