现代博弈论与多智能体强化学习系统

现在,大多数人工智能(AI)系统都是基于处理任务的单个代理,或者在对抗模型的状况下,是一些相互竞争以改善系统总体行为的代理。然而,现实世界中的许多认知问题是大群人创建的知识的结果。以自动驾驶汽车场景为例,任何座席的决策都是场景中许多其余座席行为的结果。金融市场或经济中的许多情景也是大型实体之间协调行动的结果。咱们如何模仿人工智能(AI)代理中的行为?web 多智能体强化学习(MARL)是深度学习学
相关文章
相关标签/搜索