最新最全论文合集——多智能体强化学习

AMiner平台（https://www.aminer.cn）由清华大学计算机系研发，拥有我国彻底自主知识产权。平台包含了超过2.3亿学术论文/专利和1.36亿学者的科技图谱，提供学者评价、专家发现、智能指派、学术地图等科技情报专业化服务。系统2006年上线，吸引了全球220个国家/地区1000多万独立IP访问，数据下载量230万次，年度访问量超过1100万，成为学术搜索和社会网络挖掘研究的重要数据和实验平台。web

必读论文：https://www.aminer.cn/topic网络

论文集地址：https://www.aminer.cn/topic/6017af5a92c7f9be21c931d2svg

近年来，随着强化学习在多个应用领域取得了使人瞩目的成果，而且考虑到在现实场景中一般会同时存在多个决策个体（智能体），部分研究者逐渐将眼光从单智能体领域延伸到多智能体，即多智能体强化学习（multi-agent reinforcement learning）。当同时存在多个智能体与环境交互时，整个系统就变成一个多智能体系统。每一个智能体仍然是遵循着强化学习的目标，也就是是最大化可以得到的累积回报，而此时环境全局状态的改变就和全部智能体的联合动做相关了。所以在智能体策略学习的过程当中，须要考虑联合动做的影响。学习

该论文集共收录52篇论文，最高引用数是2154，来自加利福尼亚大学伯克利分校的Pieter Abbeel在该领域发表了6篇论文，在全部学者中最多。

url

订阅了解更多论文信息，定制您的我的科研动态信息流：https://www.aminer.cn/user/notification?f=mt.net

本文同步分享在博客“AMiner科技”（CSDN）。
若有侵权，请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”，欢迎正在阅读的你也加入，一块儿分享。xml