actor-critic框架

最近发现我大自动化的思想在deep learning中很有体现呀,之前说过77要去研究bicnet了,读完之后从里面采用的actor-critic框架说起吧,这个就用到了我们自控里面反馈的思想。 据说今年几个顶会文章强化学习占到70%,在图像、NLP等等方面都广泛使用,强化学习在博弈论、控制论、运筹学、信息论、模拟优化方法、多主体系统学习、群体智能、统计学以及遗传算法等多个领域都有所应用。 上张经
相关文章
相关标签/搜索