NLP论文研读之路：A Neural Probabilistic Language Model

时间 2020-12-24

原文原文链接

文章摘要：统计语言模型通过学习来得到语言中某个序列联合概率分布，但是由于一个序列可能看上去和训练集中其他所有的语言序列都不相同,而且这种现象可能大量存在，这样的话就会存在一个维度爆炸（curse of dimensionality）的问题，也就是语言模型过于稀疏。传统的N-gram模型在语言模型中取得了一定的成功，但也无法避免稀疏性的问题。本文旨在提出一种稠密低维度的词的表达方式，使得输入每一个测

>>阅读原文<<