文本分类方法综述

本文主要总结文本分类的方法。 文本分类的本质是文本相似性的度量、计算。文本重点介绍五种相似性的度量方法:即TF-TDF,word embedding pooling,textCNN、textRNN模型,attention network、matchpyramid的深度学习方法。 1.bag方法 比如对于如下的短文本分类问题 1) bag of words(词袋模型)的做法是 2) Continuo
相关文章
相关标签/搜索