Learning to Learn: Meta-Critic Networks for Sample Efficient Learning||论文讲解

时间 2021-01-02

原文原文链接

转载：https://zhuanlan.zhihu.com/p/27629294 文章：https://arxiv.org/abs/1706.09529 我们人是基于价值观驱动的动物。我们做什么不做什么都是因为大脑里面有一杆秤在思考哪个更重要。即使有时候非常感性，也是因为感性的时候做那件事的价值最大化了。既然人拥有价值观，我们能不能让AI也拥有价值观，并利用价值观来驱动AI快速学习？答案当然是可