an image is worth 16*16 words: transformers for image recognition at scale

an image is worth 16*16 words: transformers for image recognition at scale 变压器 for 大规模图像识别。变压器用于自然语言处理,计算机视觉,变压器,图像分类,图像补丁序列时。自注意力,变压器的计算效率和可扩展性。在大规模的图像识别中ResNet50仍是最新的技术,由于自注意力加卷积的速度和可扩展性差。with the f
相关文章
相关标签/搜索