Deep Reinforcement Learning - DDPG原理和算法

时间 2020-12-24

原文原文链接

Deep Reinforcement Learning - 1 DDPG原理和算法背景描述 DDPG的定义和应用场景 DDPG算法相关基本概念定义 DDPG实现框架和算法 DDPG对于DPG的关键改进下一篇以下用RL作为Reinforcement Learning 的简称。背景描述概括来说，RL要解决的问题是：让agent学习在一个环境中的如何行为动作(act)，从而获得最大的奖励值总