句子语义表征/句子向量

大体上可以分为无监督方式和监督方式 无监督句子语义表征方法: 1、一种最经典的方法是在One-hot词语语义表征的基础上使用Bag-of-Words技术。缺点:一是它丢失了词语在句子中的顺序信息;二是它忽略了词语的语义信息,每个词的One-hot表征都是等距离的。 2、类似的还有用word2vec来替换One-hot词向量,使用Bag-of-Words技术,构成句子向量。还可以结合TF-IDF技术
相关文章
相关标签/搜索