机器学习tips:什么是pipeline?

一个典型的机器学习构建包含若干个过程 一、源数据ETL 二、数据预处理 三、特征选取 四、模型训练与验证 以上四个步骤能够抽象为一个包括多个步骤的流水线式工做,从数据收集开始至输出咱们须要的最终结果。所以,对以上多个步骤、进行抽象建模,简化为流水线式工做流程则存在着可行性,对利用spark进行机器学习的用户来讲,流水线式机器学习比单个步骤独立建模更加高效、易用。python 管道机制在机器学习算法
相关文章
相关标签/搜索