神经概率语言模型

摘要 统计语言建模的目标是学习语言中单词序列的联合概率函数。由于 the curse of dimensionality,这本质上是困难的:模型测试的单词序列可能与训练集中的单词序列不同。一种基于n-gram的传统的但非常成功的方法是,通过连接训练集中看到的非常短的重叠序列来获得泛化。我们建议通过学习词的分布式表示来对抗维数灾难,模型通过训练语句对指数级语义相关的句子进行建模,该模型同时学习每个单
相关文章
相关标签/搜索