切分也重要:基于多粒度语言单元切分的BERT模型

论文标题: AMBERT: A PRE-TRAINED LANGUAGE MODEL WITH MULTI-GRAINED TOKENIZATION 论文作者: Xinsong Zhang, Hang Li 论文链接: https://arxiv.org/pdf/2008.11869.pdf 不同粒度语言单元的切分 在深度学习时代,将语言单元切分为怎样的粒度是一个很重要的问题,它首先影响了词典的大
相关文章
相关标签/搜索