Word2vec学习笔记(一)

文章目录 word2vec 简介 常见的word embedding方法 模型 模型特例(bigram) 符号说明 计算过程说明 损失函数及链式法则关系 用梯度下降(GD)推导权重更新方程 CBow模型(多词向下文输入) Skip-Gram 模型总结 说明 模型优化 层次softmax(hierarchical softmax) 结构图 结构特点 负采样(Negative Sampling) 采样
相关文章
相关标签/搜索