Learning to Learn: Meta-Critic Networks for Sample Efficient Learning||论文讲解

转载:https://zhuanlan.zhihu.com/p/27629294 文章:https://arxiv.org/abs/1706.09529 我们人是基于价值观驱动的动物。我们做什么不做什么都是因为大脑里面有一杆秤在思考哪个更重要。即使有时候非常感性,也是因为感性的时候做那件事的价值最大化了。既然人拥有价值观,我们能不能让AI也拥有价值观,并利用价值观来驱动AI快速学习? 答案当然是可
相关文章
相关标签/搜索