特征抽取---CountVectorizer

CountVectorizer旨在通过计数来将一个文档转换为向量。当不存在先验字典时, Countvectorizer作为Estimator提取词汇进行训练,并生成一个CountVectorizerModel 用于存储相应的词汇向量空间。该模型产生文档关于词语的稀疏表示,其表示可以传递 给其他算法,例如LDA。 在CountVectorizerModel的训练过程中,CountVectorizer
相关文章
相关标签/搜索