阅读QMIX: Monotonic Value Function Factorisation for Deep Multi-Agent Reinforcement Learning

接上文VDN,本来我觉得QMIX全文会很难读,后来发现不是,哈哈,又畏难了,希望我挑战QTRAN和Qatten的时候也能这样。 QMIX 题目作者 摘要 方法 实验和结果 其他 题目作者 ICML18,作者是COMA那个团队,老师应该就是 Shimon Whiteson,好像是Peter Stone的学生,后者是做多智能体的大佬。 摘要 这篇文章是接着VDN做的,也就是对于基于team rewar
相关文章
相关标签/搜索