轻量级学习系列--2、机器学习数据清理

1、数据预处理 主要包括 •特征提取 •处理缺失数据 •数据定标 •数据转换: One-Hot encoding, One/Two/MultiGram, Bag of words, 取对数 •1、特征提取: a、以基于图像进行行人检测为例, 需要提取图像的梯度直方图 b、以自然语言处理为例, 需要提取文字的n-gram,其实就是将文字转换成数字形式,然后通过计算句子各个单词同时出现的概率(通过历史
相关文章
相关标签/搜索