{机器学习}【Reinforcement Learning】

时间 2020-12-24

原文原文链接

常识性知识： RL学习的转移过程图示（机器就是agent） agent 选择一个action输入到environment中，envirment会反馈（输出）一个reward和转移到的state，agent再根据这些信息选择新的action 基本框架 agent 根据 environment 选择 action，通过这个action 改变 environment，根据environment的变化