Spark-MLlib分类算法（逻辑回归）实战算法

时间 2019-12-06

原文原文链接

1、数据来源及开发环境开发环境：为了方便代码管理这里使用了IDEA集成开发环境，单机进行代码调试感受很方便嘛，主要环境与我前两篇博客中部署的环境一致。linux 数据源：机器学习实在中数据的获取很重要，互联网上要找到相似数据很是容易。本实例使用的是Kaggle竞赛数据（相信学习机器学习的都知道这个比赛）。数据是关于网站点击数据，主要用于推荐的页面是短暂流行仍是长久流行。下载地址，下载train.

>>阅读原文<<