如何提高强化学习的可靠性？

时间 2020-12-30

原文原文链接

https://www.toutiao.com/a6700314150565839368/ 来自网络强化学习（RL）就像攀登1000米高的岩石表面一样，需要学习如何做出连续的决定。RL的潜在应用范围很广，包括机器人(无人机控制)、对话系统(个人助理、自动呼叫中心)、游戏产业(非玩家角色、计算机人工智能)、治疗设计(药物测试、作物管理)、复杂系统控制(资源分配、流程优化)等等。已经有一些RL

>>阅读原文<<