机器学习-特征工程与模型评估1

特征工程概论 特征工程的目的 最大限度地从原始数据中提取特征以供算法和模型使用。 引用工业界的一句话:数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。 数据预处理 特征工程 数据清洗 数据清洗的具体内容 在特征工程里有一个词:“脏数据”,很可能是数据采集中的问题所导致的不正常数据。 怎么清洗脏数据 根据理论经验或者实际情况设定一个预定的阈值,在阈值之外的即视为脏数据; 根据均值方
相关文章
相关标签/搜索