【强化学习】百度Paddle7日打卡营学习心得

【前言】 挺想为每一个课节的学习内容都做个介绍,但是最近太忙没时间弄,加上还是想后面深入理解透了再说。简单做个心得记录,顺便开个坑篇 【认识强化学习】 智能的核心:与环境中交互学习 像人一样的自学? 环境:已知的→规划、未知的→探索和试错‘ 核心思想: 智能体agent 在环境environment 中学习,根据环境的状态 state ,执行动作action 并根据环境的反馈 reward(奖励)
相关文章
相关标签/搜索