Mesos+Docker+Tensorflow集群解决方案

前言 NVIDIA GPU 可以大大加快 Deep Learning 任务的运行速度;同时,GPU资源又是十分昂贵的,需要尽可能提高 GPU 资源的利用率。为了解决上述问题,我们利用 Mesos 将 GPU 资源汇聚成资源池来实现资源共享,并借用 Docker 交付深度学习的 runtime 环境,很好的解决了上述问题。该平台是基于清华大学的真实需求搭建的,从6月份开始已经为清华大学的师生提供服务
相关文章
相关标签/搜索