Tesla® K10 和 K20 GPU 是计算加速器,旨在处理全球最复杂的 HPC 难题。在 Kepler 设计过程当中,专一于高性能和顶级节能性,所以 Kepler 的效率可达上一代架构NVIDIA® Fermi 的三倍。Fermi 架构在两年前发布之时曾树立了并行计算的新标准。html
首席科学家兼研究副总裁 Bill Dally 表示:“Fermi 是计算领域的一次重大进步。它确立了 GPU 加速计算在高性能计算中的上层地位,让数十万开发者加入了 GPU 计算平台的阵营。Kepler 将一样具备颠覆性,因为简单易用、普遍适用以及高效等特色,Kepler 架构将让 GPU 普遍应用于技术计算领域。” 算法
做为一系列公布内容的一部分,NVIDIA® Tesla® K10 和 K20 GPU 曾在 GPU 技术大会 (GTC) 上正式推出,全部公布的内容都可在 GTC 在线新闻中心找到。编程
开发了一系列创新架构技术,这些技术让 Kepler GPU 性能强劲、十分节能,并且还更适用于更广范围的开发者和应用程序。主要创新以下: 服务器
SMX 流式多处理器 — SMX 流式多处理器是每一颗 GPU 的基本构成模块,咱们彻底专为高性能和节能性而对其进行了从新设计。它在每瓦特性能方面可达 Fermi 流式多处理器的三倍,于是以区区 10 台服务器机柜便可打造出计算性能高达 1 Petaflop 的超级计算机。SMX 的节能性是经过增长四倍数量的NVIDIA® CUDA® 架构核心来实现的,它同时还下降了每一个核心以及 GPU 电源门控零件在闲置时的时钟频率,还最大限度增大了专门用于并行处理核心而非控制逻辑的 GPU 区域。架构
动态并行机制 — 该功能让 GPU 线程可以动态生成新线程,从而让 GPU 动态适应数据。这大大简化了并行编程,让 GPU 加速可以应用到更广范围的流行算法上,例如自适应网格细分、高速多级法以及多栅法。ide
Hyper-Q — 该技术让多个 CPU 核心可以同时利用单个 Kepler GPU 上的诸多 CUDA® 架构核心。这大大提高了 GPU 的利用率、缩短了 CPU 闲置时间、提升了可编程性。Hyper-Q 很是适合采用 MPI 的集群应用程序。性能
GPU 工程高级副总裁兼 Kepler 首席架构师 Jonah Alben 表示:“咱们在设计 Kepler 的过程当中注重三点: 性能、效率以及易于使用。它是 GPU 加速计算领域中的一个重要里程碑,将在计算研究领域中孕育出下一轮突破。”优化
NVIDIA®Tesla® K10 和 K20 GPU
NVIDIA® Tesla® K10 GPU 可以为信号、图像以及地震处理应用程序提供全球最高的数据吞吐能力。NVIDIA®Tesla® K10 加速卡专为油气勘探和国防领域的客户进行了优化,一块加速卡包含两颗 GK104Kepler GPU,整体单精度浮点峰值性能可达 4.58 Teraflops,存储器带宽可达每秒 320 GB。网站
NVIDIA® Tesla® K20 GPU 是 Tesla GPU 系列产品中的全新旗舰产品,该 GPU 专为计算量最密集的 HPC 环境而设计。预计NVIDIA® Tesla® K20 将成为全球最高性能、最节能的 GPU,该产品于 2012 年第四季度发布。 spa
NVIDIA® Tesla® K20 是基于 GK110 KeplerGPU 而打造的。该 GPU 的双精度性能比 Fermi 架构的NVIDIA® Tesla® 产品高三倍,并且还支持 Hyper-Q 和动态并行机制等功能。GK110 GPU 预计将被新型 Titan 超级计算机和 Blue Waters 计算机所采用。前者来自美国田纳西橡树岭国家实验室,后者来自美国伊利诺伊大学厄本那香槟分校的国家超级计算应用中心。
IDC 高性能计算项目副总裁 Earl C. Joseph 指出:“在 Fermi 发布以来的两年里,混合式计算现已成为大量关键 HPC 应用程序实现更高性能的广泛方式。在将来两年里,咱们预计 GPU 将愈来愈适合在诸多应用程序上提供更高性能。”
CUDA5 并行编程平台预览版
除了 Kepler 架构之外,NVIDIA® (英伟达™) 今天还发布了 CUDA 5 并行编程平台的预览版。NVIDIA® (英伟达™) GPU 计算注册开发者计划的 20,000 多名会员都可得到该平台。这一平台将让开发者可以开始探索利用新型Kepler GPU 的方法,其中包括动态并行机制。
CUDA 5 并行编程模型上市。开发者能够在 CUDA 网站注册参加 GPU 计算注册开发者计划,得到这一预览版本。