这个高仿真框架AI2-THOR,想让让强化学习快速走进现实世界

本文来自AI新媒体量子位(QbitAI) AlphaGo的节节胜利,向人们展示了强化学习的强大能力。但要是想让这种方法作用于现实世界,指挥机器人完成开门、拿东西、放东西等等对人类来说轻而易举的任务,还需要解决一个问题: 一个强化学习模型要经历多次试错过程才能收敛,可是让它在现实世界中一次一次地试错显然有些不切实际。 为了填平这道虚拟和现实世界中的鸿沟,一个名叫AI2-THOR的新框架产生了。 AI
相关文章
相关标签/搜索