spark:ML和MLlib的区别

ML和MLlib的区别以下: 数据结构 ML是升级版的MLlib,最新的Spark版本优先支持ML。 ML支持DataFrame数据结构和Pipelines,而MLlib仅支持RDD数据结构。 ML明确区分了分类模型和回归模型,而MLlib并未在顶层作此类区分。 ML经过DataFrame元数据来区分连续和分类变量。 ML中的随机森林支持更多的功能:包括重要度、预测几率输出等,而MLlib不支持。
相关文章
相关标签/搜索