Longformer:超越RoBERTa,为长文档而生的预训练模型

星标/置顶小屋,带你解锁node 最萌最前沿的NLP、搜索与推荐技术git 文 | ChrisCao, 小轶github 前言 今天要与你们分享的是AllenAI今年发表的最新工做,Longformer——一种可高效处理长文本的升级版Transformer。做者团队提供了开源代码,你们可快速复现,直接用于本身的任务。算法 传统Tranformer-based模型在处理长文本时有着自然的劣势。由于传
相关文章
相关标签/搜索