探秘多智能体强化学习-MADDPG算法原理及简单实现

时间 2020-07-26

标签探秘智能强化学习 maddpg 算法原理简单实现繁體版

原文原文链接

以前接触的强化学习算法都是单个智能体的强化学习算法，可是也有不少重要的应用场景牵涉到多个智能体之间的交互，好比说，多个机器人的控制，语言的交流，多玩家的游戏等等。本文，就带你简单了解一下Open-AI的MADDPG(Multi-Agent Deep Deterministic Policy Gradient)算法，来共同体验一下多智能体强化学习的魅力。git 论文全称：Multi-Agent Ac

>>阅读原文<<