Open.ai新算法:一小时内训练AI系统后空翻,仅需900Bit的人类反馈数据

编 | 王艺python 编者按: 6月11日,Open.ai官方博客发文,宣布其与DeepMind安所有门合做开发的最新算法,该算法使用少许人为反馈进行强化学习,并可以处理更复杂的任务。仅需900bit的人类反馈,系统便学会了后空翻,须要人类参与的时间也从70小时将至1小时,该技术还可以被应用在更多其余方面,目前在虚拟机器人以及Atari平台的游戏上已经接受普遍测试。web 构建安全AI系统的关
相关文章
相关标签/搜索