spark-ml 逻辑回归使用记录

    最近作项目须要用一下逻辑回归模型,一开始用了spark的基于RDD的mlib,写了一个版本的脚本,后来看官方文档发现mlib目前处于维护状态,主推的仍是基于Dataframe的ml,因而重头开始写基于ml的模型脚本,哎,坚强地继续搬砖python     因为中间有个指标是事件类型,属于字符串类型,须要作单独处理,这里利用自带的StringIndexer函数, 主要是根据事件类型出现频次来
相关文章
相关标签/搜索