1.5特征(feature)

1.5 特征(feature) 特征中有三种算法:ChiSqSelector、VectorSlicer和RFormula为特征选择方法; 有三种方法:CountVectorizer、TF-IDF和Word2Vec组成三种文本特征抽取方法; 其余方法为特征变换。 特征变换又分5个类: 自然语言相关特征转换,包括:Tokenizer、Stop Words Remover、n-gram。 连续变量的离散
相关文章
相关标签/搜索