sk-learn学习笔记三

通过哈希技巧实现特征向量 哈希技巧是无固定状态的,它把任意的数据块映射到固定数目的位置,并且保证相同的输入一定产生相同的输出,不同的输入尽可能产生不同的输出。scikitlearn提供了HashingVectorizer来实现这个技巧: from sklearn.feature_extraction.text import HashingVectorizer corpus = ['the', 'a
相关文章
相关标签/搜索