伯克利吴翼&FAIR田渊栋等人提出强化学习环境House3D

构建虚拟 3D 环境对于强化学习研究非常重要。近日,UC Bekerley 博士生吴翼、FAIR 研究工程师吴育昕、博士后 Georgia Gkioxari 和研究科学家田渊栋共同提交了一篇论文,提出一种基于 SUNCG 数据集构建的丰富、可扩展的高效环境 House3D。研究者用连续和离散动作空间训练强化学习智能体,改善了它们在新环境中的泛化能力。该论文目前已提交至 ICLR 2018 大会。
相关文章
相关标签/搜索