写给小白的机器学习之数据表示与特征工程详解(附实战代码)

数据类型有不少,在机器学习中,这些类型基本特征大体分为两类:git 一是如浮点数组成的连续特征 二是一般并非数值的分类特征,或者叫作离散特征 一般不管你的数据包含那种类型的特征,数据表示方式都会对机器学习模型的性能产生巨大影响,这就要求咱们要对数据进行处理,如数据放缩、特征扩充等等。github 对于某个特定应用来讲,如何找到最佳数据表示,这个问题被称为特征工程(feature engineeri
相关文章
相关标签/搜索