{机器学习}【Reinforcement Learning】

常识性知识: RL学习的转移过程图示(机器就是agent)   agent 选择一个action输入到environment中,envirment会反馈(输出)一个reward和转移到的state,agent再根据这些信息选择新的action 基本框架 agent 根据 environment 选择 action,通过这个action 改变 environment,根据environment的变化
相关文章
相关标签/搜索