RL增强学习在无人驾驶中的应用

csdn公式编辑器不好用,就直接从word里面截图发上来一些理论公式: 长期规划问题 迷宫:复杂决策的情景----我们只有把基于搜索的和基于增强学习的算法结合,才能有效解决这类问题。 围棋:确定性的环境,长期奖励----基于搜索的和基于增强学习的算法结合 自动驾驶:环境非确定--转移函数未知 自动驾驶简介 感知、决策和控制 决策:(对安全和可靠性有着严格要求) 1 对行车计划进行长期规划 2 对周
相关文章
相关标签/搜索