2018最新实用BAT机器学习算法岗位系列面试总结(结构化数据特征工程)

特征工程,是对原始数据进行一系列工程处理,目的是去除原始数据中的杂质和冗余,设计更高效的特征来描述求解的问题与预测模型之间的关系。 特征工程主要对以下两种常用的数据类型做处理: (1)结构化数据。结构化数据类型可以看作关系型数据库的一张表,每列都有清晰的定义,包含了数值型,类别型两种基本类型;每一行数据表示一个样本的信息。 (2)非结构化数据。非结构化数据主要包括文本,图像,音频,视频数据,其包含
相关文章
相关标签/搜索