tfidf+embedding

转自:https://blog.csdn.net/pnnngchg/article/details/86500648 我们知道,tfidf和embedding都是将文本表示成包含文本信息的高维向量的方法。tfidf关注的是单词在文档中的频率,最终计算出的向量包含的信息是一种单词出现频率的tradeoff。而embedding则关注的是单词的语义。两者包含的信息不同,因此将两者结合起来表示文本是对文
本站公众号
   欢迎关注本站公众号,获取更多信息