最小熵原理系列：词向量的维度应该怎么选择？

时间 2020-12-30

标签机器学习人工智能 graphviz 算法 openssh 栏目图片处理繁體版

原文原文链接

©PaperWeekly 原创 · 作者｜苏剑林单位｜追一科技研究方向｜NLP、神经网络随着 NLP 的发展，像 Word2Vec、Glove 这样的词向量模型，正逐渐地被基于 Transformer 的 BERT 等模型代替，不过经典始终是经典，词向量模型依然在不少场景发光发热，并且仍有不少值得我们去研究的地方。本文我们来关心一个词向量模型可能有的疑惑：词向量的维度大概多少才够？先说结论

>>阅读原文<<