【人工智能】做业4: PacMan游戏 实验报告

做业4: PacMan游戏 实验报告 吴政亿 151220129 wuzy.nju@gmail.com (南京大学 计算机科学与技术系, 南京 210093)java 摘要:使用强化学习来自主玩Mr. PACMAN游戏。经过强化学习,获得Q值函数,并根据Q值函数进行决策。理解并深刻研究使用的强化算法,并尝试修改程序来提升学习性能。其中,理解epsilon greedy策略与折扣累计奖赏的含义web
相关文章
相关标签/搜索