正面挑战英伟达 NVLink,博通未来 PCIe 交换机芯片将支持 AMD AFL 互连

正面挑战英伟达 NVLink,博通未来 PCIe 交换机芯片将支持 AMD AFL 互连 (英文) IT之家 3 月 8 日消息,据外媒 ServeTheHome 报道,博通表示其未来 PCIe Gen7 交换机芯片 Atlas 4 将支持来自 AMD 的 Accelerated Fabric Link(AFL)互连。

相关推荐

封面图片

AMD公布疯狂芯片提效计划 用能效挑战英伟达会成功吗?

AMD公布疯狂芯片提效计划 用能效挑战英伟达会成功吗? 而在获奖后的演讲中,苏姿丰透露了AMD未来三年的计划,一个充满野心的计划:AMD正在努力实现2025年将计算能效提高到2020年的30倍的计划,而在这个计划之后,还有在2027年将能效提高到100倍(相对于2020年)的目标。图源:AMD计算能效,简单来说就是指计算机在执行计算任务时,利用能源的有效程度,虽然在各种算力、核心数等性能参数面前,计算能效看起来不太起眼,实质上却是核心性能、功耗管理、制程工艺等技术的体现。更高的计算能效,能够让计算机系统在运行时有着更高的效率,早在2014年,AMD就曾经设定过一个名为“25x20”的计划,希望用6年时间将AMD的处理器、显卡等产品的能效提高25倍。这个计划的结果,就是我们现在所熟知的Zen架构和RDNA架构,凭借两个架构的出色表现,AMD在2020年不仅完成了既定的目标,还超额做到了31.77倍的能效提升。AMD为何一直将计算能效提升作为核心目标之一?首先,我们从目前的AI运算需求出发,看看计算能效提升会带来什么?狂奔的超级计算中心众所周知,AI已经成为当前半导体业界最核心、最庞大的需求,这个需求正在驱动着半导体战车的车轮滚滚向前。前段时间,作为AI时代的领航者,半导体公司英伟达的市值就一度达到2.62万亿美元,甚至超过了德国所有上市公司的市值总和。让英伟达市值暴涨的唯一原因,就是其在AI计算硬件领域的统治级实力,目前全球最顶尖的专业计算卡均出自英伟达,除了主流的H100、H200等芯片外,英伟达前段时间又发布了GB100和GB200,仅单个芯片的算力就相当于以前的一台超级计算机。当然,强大的算力背后并不是没有代价的,H100的TDP高达700W,而最新的GB200的TDP更是高达2700W。而英伟达提供的官方方案中,单个GB200 NVL72服务器就可以搭载最高36个GB200芯片,仅芯片本身的功耗就最高可达97200W,并且不包括配套的其他硬件功耗。这还仅仅是开始,一个超级计算中心往往由多个服务器单元组合而成,亚马逊此前就公布了一项计划,预计采购2万个GB200用来组建一个全新的服务器集群。而走在AI研究最前沿的微软和OpenAI,前段时间更是公布了一个雄心勃勃的计划星际之门。据悉,该计划共分为五个阶段,目的是建造一个人类历史上最大的超级计算中心,预计整个计划的投资将达到1150亿美元,建成后将需要数十亿瓦的电力支持。这座‘星际之门’建成后,仅以耗电量算就足以在全球各大城市中排名前20,更何况它还只是众多计算中心的一员而已。实际上,早在去年开始,就有多份报告指出计算中心的耗电量正在猛增,并且一度导致美国部分城市出现电力供应不足的问题。从能源角度来说,一座发电厂从选址到建成运行,往往需要数年的时间,如果遇到环保组织的抗议,还有可能拖延更久。在能源问题短时间内无法解决的情况下,提高计算能效就是唯一的方法,通过更高效地利用每瓦时电力来维持更大规模的AI模型训练。实际上,有人认为OpenAI的ChatGPT-5进展缓慢,很大程度上就是受限于算力规模无法大幅度提升。苏姿丰在演讲中也提到,提高计算能效可以更好地解决能源与算力之间的矛盾,并且让超级计算中心可以被部署到更多的地方。在一些AI企业的构想中,未来每一座城市都应该拥有自己的超级AI中心,负责处理智能驾驶、城市安全等各方面的AI需求。想要达成这个目标,同时不显著增加城市的能源负担,更高计算能效的显卡就是唯一的解决方案。而且,计算能效也直接关系到AI计算的成本,只有将AI计算的成本降到更低,大面积普及AI才可能成为现实。AMD的疯狂计划在英伟达的刺激下,作为在GPU领域唯一能够与英伟达抗衡的企业,AMD一直在加速推进旗下AI芯片的研发与上市进度,并先后发布了MI300、V80等多款专业运算卡。据报道,为了能够加速AI芯片的进度,苏姿丰对GPU团队进行重组,抽调大量人员支持AI芯片的研发,以至于下一代的AMD消费级显卡发布计划受到严重影响,比如取消原定的旗舰产品发布计划,仅保留中端显卡的发布计划等。在集中科研力量后,AMD目前的进展速度飞快,最新的MI300X在性能上已经超过英伟达的H100,大多42 petaFLOPs,并且拥有高达192GB的显存,功耗却与H100相当,仅为750W。凭借优异的计算能效,MI300X成功引起了市场的关注,微软、OpenAI、亚马逊等科技巨头都提交了采购需求,让AMD在计算领域的芯片出货量暴增。根据相关机构预测,2024年AMD的AI芯片出货量可能达到英伟达出货量的10%,并在明年增长至30%。据苏姿丰介绍,为了能够提高芯片的计算能效,AMD研发了多项新的技术,比如2.5D/3D混合封装技术。利用这项技术,AMD可以在封装面积不变的前提下给芯片塞入更多的晶体管和内存,降低芯片与内存交换数据的消耗,有效提升每瓦时的计算性能。此外,AMD还将改进芯片架构,推出能效更高的新一代架构,预计最快将于2025年发布,并实现25x30(2025年计算能效提升30倍)的目标。不过,想要实现27x100(2027年计算能效提升100倍)的目标,还需要在诸多领域做出提升,仅靠制程工艺升级和架构升级恐怕还不太够。不得不说,AMD的这个计划非常疯狂,一旦成功,那么AMD将有望再次与英伟达并肩而行。那么英伟达的反应是什么?其实英伟达很早就给出了回应,早前发布的GB200就是答案,这颗史无前例的算力怪物在计算能效方面的提升同样瞩目。据英伟达的介绍,GB200的推理性能是H100的30倍,计算能效是H100的25倍(综合考虑算力、功耗等参数后的结果)。显然,英伟达的脚步也并不慢,在接下来的3年时间里,不管AMD能否完成疯狂的百倍计划,AI芯片市场都会迎来一场革新。 ... PC版: 手机版:

封面图片

Rambus推出前沿PCIe 7.0 IP产品组合 聚焦人工智能应用

Rambus推出前沿PCIe 7.0 IP产品组合 聚焦人工智能应用 据官方新闻稿描述,人工智能(AI)和高性能计算(HPC)领域的持续创新需要能够处理前所未有的数据负载的尖端硬件基础设施。为了克服这些挑战,Rambus宣布推出PCI Express(PCIe)7.0 IP产品组合,其中包括一整套IP解决方案,包括PCIe 7.0 控制器旨在提供下一代人工智能和高性能计算应用所需的高带宽、低延迟和强大性能PCIe 7.0 Retimer 用于信号再生的高度优化、低延迟数据路径PCIe 7.0 多端口交换机,具有物理感知功能,支持多种架构XpressAGENT 使客户能够快速推出首款芯片Rambus 控制器 IP 的主要功能包括支持 PCIe 7.0 规范,包括 128 GT/s 数据传输速率实施低延迟前向纠错 (FEC),提高链路稳健性支持固定大小的 FLIT,实现高带宽效率向后兼容 PCIe 6.0、5.0、4.0 等。通过 IDE 引擎实现安全性支持 AMBA AXI 互连Rambus Retimer IP 的主要功能包括支持 PCIe 7.0 规范 x2 至 x16 通道预集成 Xpress Agent 调试分析 IP具有自适应行为的高度可配置均衡算法电源模式和智能时钟门控可实现对控制器 IP 的最佳管理Rambus PCIe XpressAGENT 的主要功能包括用于 PCIe 控制器、重定时器和交换机 IP 的非侵入式智能 IP 内调试/逻辑分析仪,可实现快速的首批芯片调试可与任何符合 PIPE 标准的 SerDes 集成通过与 CPU 无关的 API,在本地或远程统一访问 PHY、MAC 和链路层通过远程访问为现场产品提供预先监控和诊断功能除 PCIe IP 产品组合外,Rambus 还为 HBM、CXL、GDDR、LPDDR 和 MIPI 提供业界领先的接口 IP。 ... PC版: 手机版:

封面图片

英伟达现在每年都会发布新的人工智能芯片

英伟达现在每年都会发布新的人工智能芯片 得益于人工智能芯片,英伟达在一个季度内就实现了140亿美元的利润,并且从现在开始就开始蓬勃发展:首席执行官黄仁勋表示,英伟达现在将每年设计新芯片,而不是每两年一次。黄仁勋在该公司2025财年第一财季财报电话会议上说:“我可以宣布,继 Blackwell 之后,我们将推出另一款芯片,周期为一年。”到目前为止,英伟达大约每两年推出一次新架构,例如2020年推出 Ampere、2022年推出 Hopper、2024年推出 Blackwell。 黄仁勋表示,英伟达也会加速其生产的所有其他芯片,以适应这一节奏。“我们将以非常快的速度推动它们的发展。”他表示,“新的 CPU、新的 GPU、新的网络 NIC、新的交换机……大量芯片即将问世。”

封面图片

英伟达将生产基于 Arm 的 PC 芯片,向英特尔发起重大新挑战

英伟达将生产基于 Arm 的 PC 芯片,向英特尔发起重大新挑战 英伟达主导着人工智能计算芯片的市场。现在它要来挑战英特尔在个人电脑领域长期的主导地位。 两位知情人士告诉路透社,英伟达已经悄悄开始设计可以运行微软 Windows 操作系统并使用 Arm 公司技术的中央处理器(CPU)。 据两位知情人士透露,AMD公司也计划使用 Arm 技术为 PC 制造芯片。 一位知情人士表示,英伟达和 AMD 最早可能会在 2025 年就开始销售 PC 芯片。英伟达和 AMD 将加入高通行列,高通自 2016 年开始就在为笔记本电脑制造基于 Arm 架构的芯片。

封面图片

AMD称定制小芯片设计是未来 UCIe将创建完整生态系统

AMD称定制小芯片设计是未来 UCIe将创建完整生态系统 近日,AMD高级副总裁、企业研究员兼产品技术架构师Sam Naffziger与AMD首席技术官Mark Papermaster在一次视频对话中表示,UCIe规范可以创建完整生态系统,实现定制的小芯片设计。Sam Naffziger称,AMD的Infinity Fabric接口打造了独特的EPYC、Ryze和Instinct MI300系列产品,提供了无与伦比的核心数量、性能和功能集,“(接口)延迟太高,功耗太高,但我们有一个有能力的工程师团队,他们说,‘我知道如何解决这个问题’,‘我将提供一个轻量级的接口’,‘我将使它变校’,‘我将消除延迟周期’,如果我们达到了这些目标,现在我们就有了一个多芯片解决方案,就像一个单芯片SoC,我们设定了这些目标,然后监督团队的执行以实现目标,它是如此具有变革性”。Sam Naffziger认为,UCIe可以做的是拥有一个小芯片生态系统和库,为第三方开发模块化设计能力提供了机会,那么一个定制平台就能合理利用其他公司的某一个小芯片并连接起来。未来将看到更多这样的产品涌现,但这需要标准和经过深思熟虑的设计平台能力。UCIe全称为Universal Chiplet Interconnect Express,即通用小芯片互连通道,这是一种开放的行业标准,旨在封装级别建立互连。AMD是开发UCIe规范的团队之一,但是否计划开发与UCIe兼容的芯片仍有待观察。去年在美国加利福利亚州圣何塞举办的“Intel Innovation”峰会上,英特尔CEO帕特-基尔辛格(Pat Gelsinger)展示了世界上首个采用UCIe连接的芯片,代号“Pike Creek”。其带有采用英特尔自家Intel 3工艺制造的UCIe IP模块,同时还有台积电(TSMC)N3E工艺制造的新思科技(Synopsys)UCIe IP模块,两个模块之间通过英特尔EMIB先进封装技术进行连接。 ... PC版: 手机版:

封面图片

【围攻英伟达,三大巨头的芯片再出招】博通的Jericho3-AI,瞄准英伟达的Infiniband;微软正在开发代号“Athen

【围攻英伟达,三大巨头的芯片再出招】博通的Jericho3-AI,瞄准英伟达的Infiniband;微软正在开发代号“Athena”的人工智能芯片;谷歌也于近期公布了TPU v4的细节,号称比英伟达A100更快、更节能。 #抽屉IT

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人