单颗GPU计算能力太多、太贵?阿里云发布云上首个轻量级GPU实例

摘要: 阿里云发布了国内首个公共云上的轻量级GPU异构计算产品——VGN5i实例,该实例打破了传统直通模式的局限,能够提供比单颗物理GPU更细粒度的服务,从而让客户以更低成本、更高弹性开展业务。html

在硅谷举办的2019年NVIDIA GPU技术大会(GTC)上,阿里云发布了国内首个公共云上的轻量级GPU异构计算产品——VGN5i实例,该实例打破了传统直通模式的局限,能够提供比单颗物理GPU更细粒度的服务,从而让客户以更低成本、更高弹性开展业务。安全

在该实例发布以前,业内均采用以单颗物理GPU为单位的云端异构计算服务,这有利于客户得到强有力的计算能力。如阿里云在2017年10月推出了业界最全的异构计算家族,以及基于一个异构平台的高性能计算平台E-HPC,为用户提供单颗起步至超大规模的弹性计算服务。当用户业务遇到业务高峰时能够在数分钟内实现扩容,大幅下降了企业使用异构计算能力的门槛,目前已服务于新浪微博、旷视科技、中国工程院等众多企业和机构。架构

然而,在很多使用异构计算服务的场景中,“计算资源过剩”问题也尤其明显。以云游戏为例,企业一般仅须要一颗物理GPU几分之一的计算能力便可流畅完成图形或视觉计算;人工智能领域也存在相似问题,深度学习推理场景对GPU的计算资源消耗可能仅仅是训练阶段的数十分之一,甚至更少。对于这类应用场景而言,轻量级计算异构产品能够提高系统灵活性,并大幅下降成本。框架

而阿里云本次首家提供云上轻量级GPU实例,意味着用户能够用更细粒度的计算资源开启业务。该产品基于NVIDIA Tesla P4 GPU,支持多种规格,企业能够按需选择实例规格或者在云市场选择NVIDIA Quadro虚拟工做站,适用于云游戏、AR/VR以及图形处理等随需应变的GPU计算场景。运维

阿里云表示,5月还将发布基于NVIDIA T4的GPU异构计算产品VGN6i实例,NVIDIA T4采用最新的Turing架构,在虚拟化环境中更为灵活,可加速深度学习和推理工做流程的Tensor Core,以及可加速光线追踪和批量渲染的RT Core。机器学习

该产品由阿里云与NVIDIA合做研发,集成了阿里云智能资源调度技术,用户能够按需选择适量的计算资源;同时,还采用了安全隔离技术,实现不一样用户之间的强隔离,有效防止信息泄漏;除此以外,QoS控制技术保障了每一个用户的GPU资源不被其余租户抢占。性能

阿里云智能异构计算产品专家张新涛表示,“随着轻量级GPU异构计算产品的推出,阿里云实现了GPU的异构计算场景全覆盖,能够为用户提供从从轻量到高性能计算的服务。”学习

云端异构计算并不是单纯地堆积硬件性能,须要作深度的软硬件结合及优化才能发挥其性能优点。阿里巴巴集团在异构计算领域拥有多年研发经验,该技术大规模应用于拍立淘、商品分类等场景。优化

做为全球前3、国内第一的云服务商,阿里云拥有丰富的异构计算产品,具有智能调度、自动运维、实时扩容等能力,结合业界首个自研的异构计算加速框架Ali-Perseus,能够同时支持TensorFlow、Caffe、MxNet、Pytorch等流行机器学习框架在集群训练和推理时的加速,最高能够将深度学习任务成本下降50%以上。
2018年12月,在斯坦福大学发布的最新DAWNBench深度学习推理榜单,阿里云异构计算得到了图像识别性能及成本双料冠军。阿里云

直播观看地址:https://yq.aliyun.com/live/938
查看产品VGN5i:https://www.aliyun.com/product/ecs/gpu
VGN5i·释放GPU计算新动力:https://promotion.aliyun.com/ntms/act/vgpu.html
阿里云新品发布会频道:https://promotion.aliyun.com/ntms/act/cloud/product.html
阿里云新品发布·周刊:https://yq.aliyun.com/publication/36

 



本文做者:云攻略小攻

原文连接

本文为云栖社区原创内容,未经容许不得转载。

相关文章
相关标签/搜索