RL加强学习在无人驾驶中的应用

csdn公式编辑器很差用,就直接从word里面截图发上来一些理论公式:程序员 长期规划问题算法 迷宫:复杂决策的情景----咱们只有把基于搜索的和基于加强学习的算法结合,才能有效解决这类问题。安全 围棋:肯定性的环境,长期奖励----基于搜索的和基于加强学习的算法结合网络 自动驾驶:环境非肯定--转移函数未知架构 自动驾驶简介框架 感知、决策和控制编辑器 决策:(对安全和可靠性有着严格要求)分布式
相关文章
相关标签/搜索