简版Word2vec的理解

一. 预备知识 1.1 哈夫曼树 (最优二叉树) 哈夫曼树 :带权路径长度之和(WPL)最小的二叉树 。 WPL唯一,但哈夫曼树不唯一,左右子树可以交换。 权值越大的节点离根节点越近。 词频越大的词离根节点越近。 构造过程中,每两个节点都要进行一次合并。 因此,若叶子节点的个数为n,则构造的哈夫曼树中新增节点的个数为n-1。 哈夫曼编码:即满足前缀编码的条件,又能保证报文编码总长最短。 前缀编码:
相关文章
相关标签/搜索