Hot Chips 34:摆脱x86束缚 英伟达详解Grace服务器CPU设计
HotChips34:摆脱x86束缚英伟达详解Grace服务器CPU设计在HotChips大会期间,英伟达详细介绍了该公司的GraceCPU设计。作为一种经典意义上的中央处理器,其旨在取代英特尔至强(Xeon)/AMD霄龙(EPYC)竞品,以在预先构建的高性能计算(HPC)服务器中扮演串行处理的角色——因为每台服务器的六张GPU加速卡需要通过CPU进行互连。(viaWCCFTech)据悉,该公司不仅研究了CPU层面的I/O与机器架构的瓶颈,还意识到了其计算服务器需要专门为这样的应用场景而定制中央处理器。得益于针对NVIDIAAPI的高度架构优化,GraceCPU就此应运而生。作为该公司首款服务器CPU产品,其效用可与Intel/AMD竞品一较高下。作为一款单芯片,其采用了台积电N4(4nmEUV)工艺制造,且英伟达将带有一两颗GraceCPU+一颗H100的板子称作Superchip或GraceHopper超级芯片。可知每个GraceCPU包含了一个900GB/s的交换结构,以及一个带宽达到PCIe5.0x16七倍的CoherentInterface接口。后者也是将相伴的H100或节点上相邻的超级芯片、与一致的内存访问连接起来的关键。GraceCPU的串行处理能力,由72核心的ARMv964-bitCPU提供,而一枚超级芯片则包含了144个核心。主内存采用了LPDDR5x接口(支持ECC),每个‘插槽’的带宽高达1TB/s——媲美超过24个通道的DDR5方案。此外具有68条PCIe5.0扮演了关键的串行IO接口角色,其主要被用于连接NVMe存储设备,且芯片的标称峰值TDP功耗达到了500W。随着GraceCPU的亮相,英伟达展示了该公司为企业和HPC应用场景设计大型多核处理器方面的强大工程实力。TechPowerUp指出:鉴于ARM已大幅缩小与x86-64平台的性能、效率和IPC表现差距,我们也不难理解绿厂为何没能拿到蓝厂的x86许可,原本它有望交付出与英特尔相媲美的企业级处理器。即便如此,英伟达的DGX计算节点、以及后续的更多预构建工作站/服务器(涵盖众多应用场景),势必将逐渐摆脱传统x86CPU、并用Grace及其继任者取而代之。相关文章:NVIDIA推出用于HPC和AI场景的Grace和GraceHopper超算芯片NVIDIAGrace处理器详情公布:功耗500W、性能不及Zen2...PC版:https://www.cnbeta.com/articles/soft/1308515.htm手机版:https://m.cnbeta.com/view/1308515.htm
在Telegram中查看相关推荐
🔍 发送关键词来寻找群组、频道或视频。
启动SOSO机器人