word vetor

@TOCword vetor 1\计算机的运算都是数字,在处理语言时做的也是数据运算,语言由词汇含一定语法组成,词汇需要数字化表示,one-hot 可以算作一种,假设世界只有 “好好学习天天向上”6个字,也用 100000 代表好、010000 代表学 …。但是没法比较相似度,而且词汇量比较大,one-hot需要改进 2\语言中的词和上下文是有“连贯性”的,连贯性以在数学上表现起来就是相近的数字,
相关文章
相关标签/搜索