PIQA:Reasoning about physical commonsense in natural language

2019.11 AAAI 2020 论文 数据集 在本文中,我们介绍了物理常识推理的任务以及相应的基准数据集“物理交互:问答”或“ PIQA”。 尽管人们发现数据集很容易(准确度达到95%),但大型的预训练模型仍然很困难(〜77%)。 我们提供有关现有模型缺乏的知识维度的分析,这为将来的研究提供了重要的机会。 在孩子学习语言之前,他们开始根据周围物体的物理特性来形成类别和概念。这个模型的世界随着他
相关文章
相关标签/搜索