python sklearn-03:特征提取方法基础知识

特征提取方法基础知识,将不同类型的数据转换成特征向量方便机器学习算法研究 1.分类变量特征提取:分类数据的独热编码方法,并用scikit-learn的DictVectorizer类实现   2.机器学习问题中常见的文档特征向量: >>1)词库模型将文档转换成词块的频率构成的特征向量,用CountVectorizer类计算基本单词频次的二进制特征向量。 >>2)通过停用词过滤(stop_word),
相关文章
相关标签/搜索