李飞飞发表研究新成果:视觉推理的推断和执行程序(HR)

原文 论文导读:目前进行视觉推理的方法都是通过黑箱结构将输入直接映射到输出,而不是对潜在的推理过程进行明确建模。这样一来,黑箱模型学习到的是利用数据内的偏置而不是学习进行视觉推理的过程。受到模块化网络的启发,本文提出了一个视觉推理模型,由一个程序产生器和一个执行引擎构成,程序产生器用来构造进行推演的推理过程的明确表示,执行引擎能够执行生成的程序来产生答案。程序产生器和执行引擎都是通过神经网络实现的
相关文章
相关标签/搜索