NLP初步学习算法

word2vec word2ve是词聚类模型,是基于上下文的,关注的是词与上下文的共现。 算法可以用word2vec+kmeans聚类。 LDA LDA是主题聚类模型,关注的是词与文章的共现。LDA和doc2vec更与对比性。LDA很耗时,商业不喜欢用。 FastText 可以参考的博客地址 FastText是facebook开源的一个词向量与文本分类工具,模型简单且训练速度快。 FastText
相关文章
相关标签/搜索