机器学习入门笔记(二):数据的预处理

机器学习本身要通过对大量的数据进行训练进而生成模型。数据的质量就显得很重要,但我们有时拿到的数据的质量并不是那么的高,所以我们要对数据进行一些预处理,提高数据的质量。这些预处理包括采样、归一化、去噪和数据过滤等操作。 1、采样(sampling) 如果要处理的数据量很大,我们只需要从中选取部分样本进行训练即可,以达到节省计算量提高实验效率的目的,采样一般包括以下几种: 1、systematic s
相关文章
相关标签/搜索