数据清洗和转换

数据清洗和转换 实际生产环境中机器学习比较耗时的一部分 大部分的机器学习模型所处理的都是特征,特征通常是输入变量所对应的可用于模型的 数值表示 大部分情况下 ,收集得到的数据需要经过预处理后才能够为算法所使用,预处理的操作 主要包括以下几个部分: 数据过滤 处理数据缺失 处理可能的异常、错误或者异常值 合并多个数据源数据 数据汇总 对数据进行初步的预处理,需要将其转换为一种适合机器学习模型的表示形
相关文章
相关标签/搜索