多智能体强化学习-COMA

多智能体强化学习-COMA 论文全称:Counterfactual Multi-Agent Policy Gradients 论文地址:https://arxiv.org/abs/1705.08926v1 摘要 协作多智能体系统可以很自然地用于建模许多现实世界的问题,例如网络分组路由或自主车辆的协调。因此,需要新的强化学习方法来有效地学习这种系统的分散策略。为此,提出了一种新的多智能体参与者批评方
相关文章
相关标签/搜索