多智能体强化学习博弈系列(1)- 差分博弈和模糊系统

几点说明: 这个系列重点关注多智能体和强化学习在差分博弈中的应用,文章中有尝试复现的主要是双人/多人混合策略多阶段随机差分零和游戏的模拟。关于智能体、关于强化学习、关于博弈论基础的介绍,在这个系列基本不涉及。 强化学习简简简介见我之前的文章。 多智能体简简简介见我之前的文章。 有关博弈论基础的内容,e.g. 双人/多人游戏、零和/变和游戏、单一/混合策略、单一/多阶段博弈等概念,本文不涉及,有兴趣
相关文章
相关标签/搜索