论文笔记：On the Strength of Character Language Models for Multilingual Named Entity Recognition

时间 2020-12-30

原文原文链接

简介本文提出了一种简单的、语料库无关的Character-level Language Model（CLM）。该方法不需要上下文信息即可判断token是否是entity。作者进一步将该方法用于一些经典的NER系统中以提高其识别效果。 Methods 在CLM中，每一个token都被看成一个句子，每个字母看做一个词，比如“Obama”会被看做句子“O b a m a”，以此训练语言模型。本文方法