探秘多智能体强化学习-MADDPG算法原理及简单实现

以前接触的强化学习算法都是单个智能体的强化学习算法,可是也有不少重要的应用场景牵涉到多个智能体之间的交互,好比说,多个机器人的控制,语言的交流,多玩家的游戏等等。本文,就带你简单了解一下Open-AI的MADDPG(Multi-Agent Deep Deterministic Policy Gradient)算法,来共同体验一下多智能体强化学习的魅力。git 论文全称:Multi-Agent Ac
相关文章
相关标签/搜索