FUNSD dataset 数据集介绍

数据集介绍 一个可用于FUNSD(噪声很多的扫描文档)上进行表单理解的数据集。 这里的表单理解是指对表单中的文本内容进行抽取,并生成结构化数据。 数据集包含199个真实的、完全注释的、扫描的表单。 文档有很多噪声,而且各种表单的外观差异很大,因此理解表单是一项很有挑战性的任务。 该数据集可用于各种任务,包括文本检测、光学字符识别、空间布局分析和实体标记/链接。 第一个具有完整注释的公共数据集,可用
相关文章
相关标签/搜索