神经网络与强化学习

一、DQN的神经网络是怎样一种结构?有几层?什么作用?如何实现数据的记忆?如何做一些改进 (一)问题描述: qu1. 问题复杂度提高导致无法使用Q表记录全部状态:        1. 对状态的维度进行压缩,解决方案之一Value Function Approximation(值函数近似),        用w来表示函数f的参数,则有        2. 高维s和低维a的函数输入问题,低维a无需进行
相关文章
相关标签/搜索