pyspark入门---机器学习实战预测婴儿出生率(一)使用MLlib库

机器学习实战预测婴儿出生率 1.加载数据 2.数据的探索:特征相关性 3.统计校验 4.建立最后的待训练数据集 5.划分训练集和测试集 6.开始建模 7.Logistic 回归模型 8.选取出最具表明性的分类特征 9.随机森林模型 机器学习是经过 算法对训练数据构建出 模型并对模型进行 评估,评估的性能若是达到要求就拿这个模型来测试其余的数据,若是达不到要求就要 调整算法来从新创建模型,再次进行评
相关文章
相关标签/搜索