word2vect 原理2

转载于(http://www.cnblogs.com/pinard/p/7243513.html) 1. 基于Hierarchical Softmax的模型概述     我们先回顾下传统的神经网络词向量语言模型,里面一般有三层,输入层(词向量),隐藏层和输出层(softmax层)。里面最大的问题在于从隐藏层到输出的softmax层的计算量很大,因为要计算所有词的softmax概率,再去找概率最大的
相关文章
相关标签/搜索