Python-sklearn机器学习的第一个样例(5)

Step 5: 分类 虽然数据清理令人厌烦,但它却是数据分析的关键步骤。如果我们跳过这个阶段直接进入建模,会导致错误的数据模型。 记住:错误的数据导致错误的模型。永远要从检查数据开始。 现在我们已经尽可能地把数据清洗了,并且对数据集的分布和关系有了初步的认识。接下来的重要步骤就是把数据集分为:训练集和测试集。 训练集是数据集的一个随机子集,用于训练模型。 测试集也是数据集的一个随机子集(与训练集互
相关文章
相关标签/搜索