机器学习--k近邻，朴素贝叶斯，模型选择，决策树与随机森林。

时间 2021-01-13

原文原文链接

sklearn数据集与估计器数据集划分正如前文所说，我们需要一些数据来建立模型，然后该模型会根据输入的特征值预测对应的目标值。但我们的数据是一定的。这就导致了我们要将数据划分两部分，一部分用来训练模型，一部分用来作为测试用。那么它们的比例大约为多少那？ eg 训练集测试集