论文笔记:On the Strength of Character Language Models for Multilingual Named Entity Recognition

简介 本文提出了一种简单的、语料库无关的Character-level Language Model(CLM)。该方法不需要上下文信息即可判断token是否是entity。作者进一步将该方法用于一些经典的NER系统中以提高其识别效果。 Methods 在CLM中,每一个token都被看成一个句子,每个字母看做一个词,比如“Obama”会被看做句子“O b a m a”,以此训练语言模型。 本文方法
相关文章
相关标签/搜索