强化学习学习总结(一)——Qlearning

一、Qlearning算法思想构架 二、Qlearing算法程序实现  1.导入 import numpy as np import pandas as pd import time 2.给定初始值 N_STATES = 6 # 总长度the length of the 1 dimensional world ACTIONS = ['left', 'right
相关文章
相关标签/搜索