Nvidia探索将多GPU封装到一块：轻松打破旧架构极限

jopen 8年前
   <p>商业计算、可选研究、以及 4K 多屏游戏等需求，不断推升着对现代 GPU 的性能需求。根据一份近期的研究报告，Nvidia 认为正在迅速接近当前 GPU 架构模型的极限，因此需要寻找新的方法去攻坚。当前这个想法仍处于模拟阶段，但文中提到的“多芯片模块 GPU”（MCM-GPU）的概念，有望最终将多颗 GPU 模块整合到一处。</p>    <p style="text-align:center"><img alt="Nvidia探索将多GPU封装到一块：轻松打破旧架构极限" src="https://simg.open-open.com/show/32543ef07ec08faea1cf792289579d21.png" /></p>    <p>在意识到 Nvidia 将很快难以通过当前架构榨取 GPU 性能之后，亚利桑那州立大学、英伟达、德州大学奥斯汀分校、以及巴塞罗那超算中心携手展开了研究。</p>    <p>此前，厂商还可以通过在每次制程迭代时堆积更多的流处理器来提升 GPU 性能。但遗憾的是，在单一模块中塞入更多晶体管的方法，已经变得越来越困难。</p>    <p>以 Nvidia V100 GPU 为例，其已经需要代工厂商（台积电）将制程推到 12nm 的极限。此外，制造规模越来越大的模块，其成本和相关问题也不可忽视（比如因制造错误遇到的数量减少）。</p>    <p>虽然 Nvidia 可以通过将多颗 GPU 装在一块 PCB 上的方式来提升显卡性能（比如 Tesla K10 和 K80），但当前仍有一些未能解决的问题 —— 比如跨多 GPU 的任务分配就需要编程来提升硬件效率。</p>    <p style="text-align:center"><img alt="Nvidia探索将多GPU封装到一块：轻松打破旧架构极限" src="https://simg.open-open.com/show/0c15f4cc1cf173107e2250ec54b0e97e.png" /></p>    <p>于是研究人员们另辟蹊径，决定在封装技术上寻找新方法，让 Nvidia 可以将多个 GPU 模块（GPMs）封装到一块。这些 GPMs 比当代 GPU 要小一些，制造起来也更容易和便宜。</p>    <p>尽管人们对其性能仍有疑问，但研究人员声称<a href="/misc/goto?guid=4959009452521904608">近期基板技术的发展</a>（PDF）已经能够帮助其部署一种快速、强健的模块通信互联架构。从理论上来讲，其带宽可达数 TB/s 。</p>    <p>在 Nvidia 内部 GPU 模拟中，研究团队将 MCM-GPU 堆到了 256 组 SMs，而 Pascal 架构仅为 56 组 SMs 。然后团队基于当前架构进行了预测，结果显示 MCM-GPU 可提速 45.5% 。</p>    <p>此外，在同一板子上进行的多 GPU 性能对比表明，MCM-GPU 有 26.8% 的领先优势。最后，有消息称 AMD 公司也有<a href="/misc/goto?guid=4959009452615206044">类似的点子</a>（基于 Navi GPU）。</p>    <p>[编译自：<a href="/misc/goto?guid=4959009452699085641">TechReport</a> , 来源：<a href="/misc/goto?guid=4959009452775844809">Nvidia</a>（PDF）]</p>    <p>来自: <a href="/misc/goto?guid=4959009452871944332" id="link_source2">cnBeta</a></p>
Nvidia探索将多GPU封装到一块：轻松打破旧架构极限

相关资讯