Maze环境以及DQN的实现

环境 5*5的迷宫,其中(4,3)位置是出口,障碍物的位置分别为(1,1)、(1,2)、(1,3)、(1,4)、(3,2)、(3,3)、(4,2) 动做空间固然4个,上下左右 直接上代码~python import gym import tensorflow as tf import numpy as np import time import sys if sys.version_info.m
相关文章
相关标签/搜索