如何提高强化学习的可靠性?

https://www.toutiao.com/a6700314150565839368/   来自网络 强化学习(RL)就像攀登1000米高的岩石表面一样,需要学习如何做出连续的决定。RL的潜在应用范围很广,包括机器人(无人机控制)、对话系统(个人助理、自动呼叫中心)、游戏产业(非玩家角色、计算机人工智能)、治疗设计(药物测试、作物管理)、复杂系统控制(资源分配、流程优化)等等。 已经有一些RL
相关文章
相关标签/搜索