Facebook AI Research -- Enriching Word Vectors with Subword Information(fasttext 表征学习篇)

                                                   用子词信息丰富词向量 摘要: 在大型无标记的语料库中训练的连续词汇表示,对于许多自然语言处理(NLP)的任务都是有用的。许多主流的模型通过为每一个单词赋予不同的词向量而忽视了词汇的词形。这对于拥有大量词汇,许多是稀有词的形态丰富的语言而来尤其是一种限制。本论文,我们提出了一种基于 skip-gra
相关文章
相关标签/搜索