初步了解:MPI集群环境搭建html
连接:https://www.zhihu.com/question/48743915/answer/115738668git
马铁大神的phd thesis 总结里面说了一句话 大概意思是说 单纯的若是使用mpi 来实现一个算法 比spark 快五六倍是很正常的 可是spark 是一个 general 的 data flow 处理框架 就是能够在数据的生命周期里面 可使用spark 之上的具体实现来处理数据 ml 只是一部分而已 这就是spark 最大的卖点之一github
因此你用这个Prophet平台来和spark 比 ml这方面的效率固然你要快了的 由于还有不少ml 专业的平台都要比spark 快 这就不列举了
由于spark 基于 mapreduce的 这种program model 就不是适合ml的 特别是ml 里面大量参数的模型 好比lda 之类的 算法
DMTK includes the following projects:shell
(1) OpenCV的OpenCL实现了下面的哪些算法?框架
class cv::ml::LogisticRegression
Ref: How to use NVIDIA GPUs for Machine Learning with the new Data Science PC from Maingeardom
看样子你们才刚刚意识到这个事情,或者dnn就足够了。机器学习
Goto: [CUDA] Install H2O.ai,有部分GPU实现的算法。分布式
工具