强化学习入门……的入门

强化学习是机器学习里面非常重要的一个派别。智能体 (agent) 会不断执行一些操作,通过结果来学习,在不同的环境中分别应该采取怎样的行动。 在一系列教学文章里,我们可以了解不同的架构,来解决强化学习的问题。Q学习,深度Q网络 (DQN) ,策略梯度 (Policy Gradients) ,演员-评论家 (Actor-Critic) ,以及近端策略优化 (PPO) 都是将要涉及的算法。 这是本系列
相关文章
相关标签/搜索