强化学习实例3:Q-Learning和Q-Network

The Frozen Lake environment,有4 x 4网格表明湖面,有16个状态,其中S,H,F和G表明不一样的格子块,4个行为(上下左右)python S:开始块 F:冰块 H:洞 G:目标块 Q-Learning 包括Q-table(16x4)和Q-value网络 import gym import numpy as np import time env = gym.make(
相关文章
相关标签/搜索