贪心科技SkipGram 2020.4.3笔记

Skip-Gram模型理解 老铁整理的视频 明天补吧,搞不定了 独热编码不能表达两个单词相似度 不等同于词向量 独热用01稀疏向量,分布式用稠密向量 可以说分布式表示有一种含义 希望machine与apple相似度大于apple的相似度 区别:独热----》向量大小是词库大小 分布式----》长度可以设定,也就是超参数的作用 得到不同单词的词向量,句子用平均 第三个区别:容量 100维独热最多10
相关文章
相关标签/搜索