《精通特征工程》读书笔记

一、机器学习流程 数据特性: 错误数据:测量时的错误 冗余数据:对同一数据的多次表述 缺失数据 特征: 原始数据的数值表示 正确的特征应该适合当前的任务,并易于被模型所使用 特征工程: 在给定数据、模型和任务的情况下设计出最合适的特征 二、数值型数据 合理性检查:正负等 考虑特征的尺度:kmeans、knn、径向基核函数、所有使用欧氏距离的方法均需要,对特征进行标准化、区间计数 数值型特征的分布:
相关文章
相关标签/搜索