深度强化学习——从DQN到DDPG

引言算法 深度强化学习最近取得了不少进展,并在机器学习领域获得了不少的关注。传统的强化学习局限于动做空间和样本空间都很小,且通常是离散的情境下。然而比较复杂的、更加接近实际状况的任务则每每有着很大的状态空间和连续的动做空间。实现端到端的控制也是要求能处理高维的,如图像、声音等的数据输入。前些年开始兴起的深度学习,恰好能够应对高维的输入,若是能将二者结合,那么将使智能体同时拥有深度学习的理解能力和强
相关文章
相关标签/搜索