【机器学习】【Word Embedding,Word2Vec之Skip-Gram模型与负采样】

一个单词或者一个字,要被计算机理解,那就要使其变成一个对应的值,这个值可以是vector。 要在程序中运用,一个想法就是构造词汇表,然后对照词汇表,对某个单词或字构造出一个向量。例如,假设有一张10000维度的词汇表,第1个单词是a,第2个是...直到第10000个单词是zelu,那么单词a对应的vector是(1,0,0,...,0)^T,只有第一个位置是1,其余位置都是0的1000维度的向量表
相关文章
相关标签/搜索