指导Agent在XX的环境中做出最优决策的模型框架

时间 2021-01-01

原文原文链接

任务：自动驾驶具备人的行为智能（指导Agent在XX的环境中做出最优决策的模型框架）的目的。针对自动驾驶问题，提出不需要专家知识辅助的简单说明：增强学习中神经网络需要完成的任务：针对图像，通过（神经网络）抽象出任务所处环境的特征信息，将特征信息与动作行为之间建立联系（相比于传统图像识别任务：特征信息与识别目标位置、类别之间建立联系）。Agent需要与环境层（真实环境，模拟环境，游戏环境）相互试

>>阅读原文<<