简单的PPO算法笔记

学习了莫烦讲解的PPO,写了点自己的理解笔记,希望能帮到你们。 代码 代码可以去上面的链接自己下载跑一下,这边也给出我参考莫烦自己学的,基本是一样的: import gym import tensorflow as tf import numpy as np import matplotlib.pyplot as plt EP_MAX = 1000 EP_LEN = 200 BATCH = 3
相关文章
相关标签/搜索