论文笔记6:Increasing the Action Gap: New Operators for Reinforcement Learning

参考文献:New Operators for Reinforcement Learning 同名知乎:uuummmmiiii 这篇文章实在是式子多,整个看懵,网上目前没啥人看过这篇,论文有两部分,我挣扎了一下看了第一部分,所以第二部分具体作者创新了什么,做了什么相关推导我也不知道,哭泣。 如有错误还请指出,本人小白,希望帮助更多的人,一同进步。 论文分为两部分:前部分:作者介绍新提出的新算子。 后
相关文章
相关标签/搜索