神经网络与强化学习

时间 2020-12-24

原文原文链接

一、DQN的神经网络是怎样一种结构？有几层？什么作用？如何实现数据的记忆？如何做一些改进（一）问题描述： qu1. 问题复杂度提高导致无法使用Q表记录全部状态： 1. 对状态的维度进行压缩，解决方案之一Value Function Approximation（值函数近似），用w来表示函数f的参数，则有 2. 高维s和低维a的函数输入问题，低维a无需进行

>>阅读原文<<