[ 强化学习 ] —— 基础知识

时间 2021-01-08

原文原文链接

1、强化学习如何运行？强化学习主要由状态(S)、行动(A)、环境(Env)、奖励(Rewards)以及智能体(Agent)构成。智能体能够根据当前(t-1时刻)的状态(S)输出下一步动作(A)，这一过程可以用一个决策函数A=Func(S)来表示。输出下一步动作(A)后，智能体随即进入下一时刻(t时刻)的状态(S’)。同时，由于不知道这一决策的好坏，环境(Env)需要将这一时

>>阅读原文<<

1. 强化学习-基础知识
2. [ 强化学习 ] —— 基础知识
3. 强化学习基础知识
4. 《强化学习》基础知识（一）
5. 强化学习基本知识
6. 强化学习(一) - 基础认知
7. 强化学习笔记1-Python/OpenAI/TensorFlow/ROS-基础知识
8. 强化学习task01基础
9. 强化学习基础
10. 强化学习——（1）基础
更多相关文章...
• Rust 基础语法 - RUST 教程
• R 基础运算 - R 语言教程
• Kotlin学习（二）基本类型
• Kotlin学习（一）基本语法