深度强化学习落地宝典（5）——状态空间篇

时间 2021-01-12

标签人工智能深度强化学习 AI落地繁體版

原文原文链接

目录前言状态设计的四个步骤任务分析相关信息筛选直接相关信息间接相关信息相关信息预处理统一性考虑形式统一逻辑统一效果验证模仿学习验证直接验证缺省验证总结前言 DRL的状态信息代表了agent所感知到的环境信息，以及因自身的action带来的变化。状态信息是agent制定决策和评估其长期收益的依据，而状态设计的好坏直接决定了DRL算法能否收敛、收敛速度以及最终性能，兹事

>>阅读原文<<