3大芯片厂高性能计算战火升级:争相加速全球最快超算、推动HPC上云

OPEN编辑 5年前

  2019 年尾声将至,高性能计算领域硝烟又起。近日,英伟达、英特尔、AMD 等芯片厂商在高性能计算(HPC)上新动作连连,再次升级市场竞争。

  对于几家芯片大厂来说,HPC 的市场可能没有数据中心的市场那么大,但是随着人工智能时代的到来和数据科学的爆发,它的增长趋势将不容忽视。

  本周举办 2019 国际超级计算大会(SC19)上,芯片巨头们便展开了正面交锋。


来源:英伟达

  英伟达宣布几项重要动作,以推进其在 HPC 上的布局:包括发布一款参考设计平台,将 CUDA 加速带入到 Arm 架构当中,帮助企业能够快速构建 GPU 加速的 Arm 服务器;和微软合作构建搭载在 Microsoft Azure 云上的新型 GPU 加速超级计算机,将超快的计算能力带到了 Azure 系统;推出软件套件 Magnum IO,专为解决存储和输入/输出(I/O)遇到瓶颈这一问题进行了优化,可以更好地帮助数据科学家和 AI 研究人员解决数据瓶颈问题。

  据介绍,此次发布的全新 NDv2 实例是 Azure 上规模最大的一次部署,该产品专为处理要求苛刻的 AI 和高性能计算应用而设计,是全球速度最快的超级计算机之一,可在一个 Mellanox InfiniBand 后端网络上提供多达 800 个互联的 NVIDIA V100 Tensor Core GPU。

  另外,对于用户来说,他们将可以在自己的桌面中租用整台 AI 超级计算机,其性能与那些需要数月时间才能完成部署的大型本地超级计算机相匹配。

  英伟达副总裁兼加速计算总经理 Ian Buck 表示:“此前,只有一些全球性的大型企业和机构才能使用超级计算机进行 AI 和高性能计算。而这款在 Microsoft Azure 上推出的新产品实现了 AI 的大众化,使更多人能够获得基础工具,来解决一些全球最大的挑战。”


来源:英伟达

  而和 Arm 在服务器上的进一步合作,丰富了现有的高性能计算架构业态。对此,英伟达 CEO 黄仁勋称:“高性能计算正在崛起。机器学习和 AI 领域的突破正在重新定义科学研究方法,并且可能带来激动人心的新架构。从超大规模云到百万兆级超级计算,英伟达 GPU 与 ARM 的组合让创新者们能够为不断增加的新应用创建系统。”

  值得一提的是,同样在 SC19 的场合上,英特尔也高调宣布其推出的首款为高性能计算设计的 GPU


来源:英特尔

  据介绍,英特尔推出的“Ponte Vecchio”,是一款专为高性能计算建模、模拟工作任务和人工智能训练而设计的 GPU,将基于英特尔新一代 7 纳米工艺进行制造。此前,英特尔首席执行官 Bob Swan 曾在 10 月的财报电话会议上提到其将进军独立 GPU 的计划。与英伟达的 CUDA 接口类似,英特尔还推出了面向开发者的 ONEAPI 编程接口,以帮助开发者实现跨不同计算体系结构的软件开发。

  Ponte Vecchio 有望整合到美国能源部(DOE)计划于 2021 交付的下一代百亿亿次超级计算机 Aurora 中。据称 Aurora 配备了两个 Intel Xeon Sapphire Rapids 处理器和六个 Intel Xe Ponte Vecchio 图形卡。

  尽管英特尔是生产超级计算机的微处理器的领导者,并能在其芯片组中提供 GPU 功能,但独立 GPU 对英特尔来说是一个相对较新的领域,而这一领域一直由英伟达和 AMD 主导。

  今年以来,AMD 在高性能计算领域也吸引了一些新客户,包括将负责打造世界最强超级计算机之一 Frontier(同样于 2021 年交付),以及亚马逊 AWS 正在扩大 AMD Epyc 处理器使用规模。在 SC19 上,AMD 同样宣布将超算能力带到云上,将推出两个新的 Amazon Elastic Compute Cloud(Amazon EC2)计算优化实例。

  如今,GPU 在这些大型计算机中越来越重要,正在成为完成大型计算任务的必需品。近日发布的最新一期全球超级计算机榜单 top 500 也显示,有越来越多的超级计算机系统都配备了图形处理加速芯片。


最新一期 TOP 500 榜单,整体来看中国在数量上的领先优势进一步扩大,但美国超算的整体性能仍是第一(来源:TOP 500)

  尽管前 10 的超算排名并无变化,但入榜门槛从上半年的 1.022 petaflops 提高到 1.14 petaflops,500 台超算中 470 台使用英特尔 CPU,IBM 有 14 台,AMD 有 3 台。这次榜单中,AMD EPYC 处理器上榜成为一大亮点,这也是 AMD 平台时隔多年首次重返顶级超算行列。

  目前,全球排在前 4 位的超算为:橡树岭国家实验室的 IBM 超算 Summit 运算速度 148.6 petaflops;劳伦斯利物莫国家实验室的 IBM 超算 Sierra 运算速度 94.6 petaflops,中国的神威太湖之光第三运算速度 93 petaflops;天河二号 A 以 61.4 petaflops 排名第四。

  Wells Fargo 分析师在一份报告中写道:“随着核心增速的放缓,2019 年 11 月的排行榜再次凸显了 GPU 在保持计算机性能增长方面日益重要的作用,行业可以通过增加加速器的使用来保持计算机性能提升,目前加速器占所有部署核心的 27%,而 2018 年 11 月这一比例为 24%。”