从0到1-强化学习篇

https://www.toutiao.com/a6672206404272521731/ 0x01 强化学习在从0到1中已经介绍了基本的思想——从0到1:学安全的你不该懂点AI?,现在再详细介绍下。 强化学习的核心逻辑,那就是智能体(Agent)可以在环境(Environment)中根据奖励(Reward)的不同来判断自己在什么状态(State)下采用什么行动(Action),从而最大限度地提高
相关文章
相关标签/搜索