Learning Against Non-Stationary Agents withOpponent Modelling & Deep Reinforcement Learning

17年nips beach的文章,这个文章是通过为对手建模,然后更好的切换自己的对战策略的一个方法。 这篇文章,主要是对里面不确定度有了很好的应用,才能正确的在不同的策略之间比较正确的切换。 主要是对两种方式进行了实验: 首先我们针对第一种来设计算法,而本文也是主要针对第一种情况进行的,第二种用来比较 本文提出了SAM算法switching Agent Model 首先我们逐步介绍他的compne
相关文章
相关标签/搜索