Learning Against Non-Stationary Agents withOpponent Modelling & Deep Reinforcement Learning

时间 2021-07-14

原文原文链接

17年nips beach的文章，这个文章是通过为对手建模，然后更好的切换自己的对战策略的一个方法。这篇文章，主要是对里面不确定度有了很好的应用，才能正确的在不同的策略之间比较正确的切换。主要是对两种方式进行了实验：首先我们针对第一种来设计算法，而本文也是主要针对第一种情况进行的，第二种用来比较本文提出了SAM算法switching Agent Model 首先我们逐步介绍他的compne