小常识2-机器学习数据预处理

 小常识2-机器学习数据预处理 机器学习里有一句名言:数据和特征决定了机器学习的上限,而模型和算法的应用只是让我们逼近这个上限。   主要包括三部分: 一是获取数据、数据抽样 二是数据探索 三是数据预处理与清洗    获取数据,数据抽样 如何保证取样数据的质量?是否在足够范围内有代表性?数据样本取多少合适?如何分类(训练集、测试集、验证集)等等。当要处理或者要分析的数据量比较大可以使用抽样技术:
相关文章
相关标签/搜索