AMD公布AI加速卡路线图:紧随NVIDIA每年一更新 2025年就出CDNA4架构

AMD公布AI加速卡路线图:紧随NVIDIA每年一更新 2025年就出CDNA4架构 这款加速卡将配备高达288GB的HBM3E内存和6TB/s的内存带宽,提供1.3PFLOPs的FP16和2.6PFLOPs的FP8计算性能,能够处理高达1万亿参数的服务器。AMD还将在2025年推出的MI350系列,该系列将基于下一代CDNA 4架构,并与OAM兼容。MI350系列将基于3nm工艺技术,同样提供高达288GB的HBM3E内存,并支持FP4/FP6数据类型。2026年,AMD计划推出基于全新CDNA架构,简称为"CDNA Next"的MI400系列。在性能方面,CDNA 3架构预计将比CDNA 2提高8倍,而CDNA 4架构预计将比CDNA 3提供大约35倍的AI推理性能提升。AMD还分享了与NVIDIA Blackwell B200 GPU的比较数据,MI350系列预计将提供比B200多50%的内存和多20%的计算TFLOPs。AMD还重申了上周公布的UALink(Ultra Accelerator Link)的最新消息,这是一个由多家厂商包括微软、英特尔、思科、博通、Meta、惠普等共同开发的新型高性能、开放和可扩展的AI互连基础设施。 ... PC版: 手机版:

相关推荐

封面图片

AMD减少RDNA 2架构高端GPU供应

AMD减少RDNA 2架构高端GPU供应 据外媒报道,AMD正在减少RDNA 2架构GPU的供应,特别是高端型号,Radeon RX 6900/6950 XT已经很难找到,Radeon RX 6800和6800 XT也很少,只有个别牌子单独一两个型号在销售。有证据表明,AMD已停产了RDNA 2架构的Navi 21 GPU,随着过去半年多库存逐渐枯竭,最终相关产品也慢慢消失。事实上,在搭载Navi 31的Radeon RX 7900系列发布时,AMD仍然有较多的Navi 21芯片库存。为了给新产品上市让路,原有的Radeon RX 6800/6900系列显卡需要降价出售,这一定程度上影响了后续RDNA 3架构产品的发布,所以相隔较长时间后,AMD才推出了搭载Navi 32的Radeon RX 7700/7800系列,逐步更新主流及中高端产品线,这时候距离Radeon RX 7900系列的发布已经相隔9个月。随着现有Radeon RX 6800/6900系列显卡供应量大幅度减少,AMD也在慢慢调整产品线,比如原来仅面向中国市场销售的Radeon RX 7900 GRE在其他地方也开始销售了。不过AMD仍然保留了部分RDNA 2架构显卡,比如Radeon RX 6750 GRE,以填补产品线的空缺。AMD计划在2024年推出RDNA 4架构GPU,或许要等到下一代显卡上市,RDNA 2架构GPU的库存才会彻底消耗完。 ... PC版: 手机版:

封面图片

AMD Zen5C、Zen6架构细节曝光 核心数创新高

AMD Zen5C、Zen6架构细节曝光 核心数创新高 访问:NordVPN 立减 75% + 外加 3 个月时长 另有NordPass密码管理器 这意味着在Ryzen CPU等双CCD部件上,核心数可达到32个,或者使用相同CCD布局最多可达64个核心。Zen 4在顶级EPYC芯片上部署了多达12个CCD,而Zen 4C则有多达8个CCD,后者每个CCX包含8个核心,最多128个核心。在Zen 5架构中,AMD将堆叠多达16个CCD,而Zen 5C架构中将堆叠12个CCD。Zen 5C芯片将采用单CCX设计,总共16个核心,最多可达192个核心。根据此前报道,Zen6架构将采用2nm工艺制造,IPC性能预计再提升10%,并支持16通道内存,加入AI/ML FP16浮点指令等新技术,同时还将引入PCIe 6.0,提供更高的I/O带宽。 ... PC版: 手机版:

封面图片

AMD苏姿丰最新发声:现在处于AI大周期开端

AMD苏姿丰最新发声:现在处于AI大周期开端 AMD是全球第二大GPU厂商和主要的CPU厂商之一,在GPU领域市场仅次于英伟达,在CPU领域是英特尔的竞争对手。基于此,AMD也在打GPU+CPU的组合。苏姿丰表示,今年第四季度AMD将推出MI325 X,将搭载HBM3E(高带宽内存)存储器,内存更大且计算能力有所提升。MI350系列以及MI400系列将在明后两年陆续推出。其中,MI300 X、MI325 X采用CDNA3架构,MI350将采用CDNA4架构,MI400将采用下一代CDNA架构。而在业内看来,这一速度与英伟达发布的计划看齐。“对人工智能的需求正加速增长,我们处于一个长达十年的人工智能大周期的开端。”苏姿丰表示,去年AMD推出了MI300 X加速器,后续每年都会推出新的产品系列。具体来看,今年AMD将推出的MI325 X有288GB高速HBM3E内存,内存带宽达每秒6TB。苏姿丰表示,单个搭载了8块MI325 X加速器的服务器可以运行参数量高达1万亿的大模型,这是搭载英伟达H200的服务器可支撑的模型尺寸的两倍。2025年,AMD将推出的CDNA4架构将带来该公司史上最大的人工智能世代飞跃。MI350采用先进的3nm工艺制程,支持FP4(四位浮点数)和FP6数据类型。“当我们回顾过往,AMD推出CDNA3时,人工智能性能是上一代的8倍,而CDNA4性能将比CDNA3增长35倍。”苏姿丰表示,MI350的内存将是B200的1.5倍,性能提升了1.2倍。H200和B200都是英伟达的AI芯片,分别于2023年和2024年发布。其中,B200采用Blackwell架构,英伟达将两块B200 CPU芯片和一颗Grace CPU芯片集成在一块GB200主板上,用互联技术组合以提高性能。据黄仁勋2日晚间透露,英伟达将“一年一更”,2025年推出Blackwell Ultra,2026年推出新架构Rubin,2027年推出Rubin Ultra。同样“一年一更”的AMD将与英伟达直接对垒。“现在多数数据中心的处理器已使用超过5年了,许多企业希望更新数据中心的计算基础设施并新增AI能力。许多企业客户也希望在不增加GPU的情况下,进行通用计算和人工智能计算。AMD是唯一一家能向数据中心提供全套CPU和GPU网络解决方案的企业。”苏姿丰表示。苏姿丰称,AMD将推出第五代面向数据中心的EPYC CPU处理器,代号为Turin。该处理器基于Zen5架构,将于今年下半年推出,旗舰产品有192个Zen5核心和384个线程。苏姿丰介绍,当运行较小的大语言模型时Turin的性能优势突出。面向台式电脑,苏姿丰还发布了AMD锐龙9000系列桌面处理器,该系列采用Zen5架构,第一批产品有Ryzen 9 9950X、Ryzen 9 9900X、Ryzen 7 9700X和Ryzen 5 9600X,将于7月上市。此外,AMD推出了代号为Strix Point的Ryzen(锐龙)AI 300系列,面向笔记本电脑领域。据苏姿丰介绍,Ryzen AI 300系列采用Zen 5架构,可以在本地运行AI工作负载。Ryzen AI 300系列搭载XDNA AI NPU(神经处理单元),NPU算力可达50 TOPS。该系列对比同行其他新的x86和ARM CPU,在单线程响应、内容创建、多任务处理方面有更高性能。黄仁勋此前抵达台北后,邀请了供应链伙伴鸿海集团、广达电脑、华硕、纬创等企业负责人聚餐。AMD也在发布环节拉起了“朋友圈”。苏姿丰邀请了微软、惠普、华硕、联想企业负责人上台分享了双方合作和AI应用内容。微软相关负责人在台上表示,Copilot(AI助手)+PC可以在PC本地和云上提供AI服务,这将有更快的响应时间和更低的成本,但这要求每台Copilot+PC设备能至少支持40TOPS算力。值得注意的是,面对英伟达在AI领域的强势,AMD等科技厂商近期都在试图增强自身的话语权。包括谷歌、Meta、AMD、英特尔、博通、思科、惠普在内的八家科技巨头不久前宣布成立一个新的行业组织,即超加速器链接推广小组(UALink Promoter Group),意在制定行业标准,指导数据中心内AI加速器芯片之间连接组件的发展。“在很短的时间内,科技行业已经接受了AI和HPC揭示的挑战。在追求效率与性能提升的过程中,加速器,尤其是GPU的互连,需要一个全面的视角。”超以太网联盟主席 J Metz说。 ... PC版: 手机版:

封面图片

AMD Zen6架构继续飞跃 核显跨越下下代RDNA5

AMD Zen6架构继续飞跃 核显跨越下下代RDNA5 Zen6的服务器版代号为Morpehus(古希腊神话梦神摩耳甫斯),消费级版代号则是“Medusa”(美杜莎)。最新说法称,Medusa Zen6会进入新的2.5D互连封装技术,取代现在传统式多die互连的chiplet小芯片,从而提升传输带宽与性能。Zen6架构的锐龙还会集成RDNA5架构的GPU核显,这也意味着,尚未露面的RDNA4会被跳过去。至于为何这么做,尚不清楚,可能是RDNA4提升不够大,也可能是RDNA5的进展更快。有趣的是,就在不久前,微软关于Xbox主机的一份文档中,就提到了Zen6、Navi5后者就是RDNA5家族。根据此前曝料,Zen6架构将会全面升级,制造工艺升级到CCD 2nm、IOD 3nm,CCD再次升级为原生32核心,IPC性能再提升10%,支持16通道内存,加入AI/ML FP16浮点指令等等。理论上,Zen6 EPYC可以做到庞大的256核心512线程!4 ... PC版: 手机版:

封面图片

AMD没有骗我 Zen5架构同频性能提升多达17%

AMD没有骗我 Zen5架构同频性能提升多达17% 虽然官方没有明说,但基本可以证实,锐龙AI 9 365是由4个Zen5、6个Zen5c混合组成的,前者最高频率5.0GHz,后者测试显示可达3.3GHz。对比对象是Zen3架构的锐龙7 7735U 4.8GHz、Zen4架构的锐龙7 7840U 5.1GHz。SPEC CPU测试中,所有处理器的频率都固定在4.8GHz,实测显示Zen5对比Zen4、Zen3分别领先22.28%、9.71%。Zen5c 3.3GHz的性能就没那么高了,只相当于Zen5的大约70%,但这也比Intel的能效核好得多,对比上代Zen4c则提升了超过10%。GeekBench 6、GeekBench 5测试中只跑单核性能,所有处理器使用默认频率,换算下来Zen5 IPC的提升幅度分别为115.28%、117.66%,这和AMD宣称的非常接近。 ... PC版: 手机版:

封面图片

导入CDNA3架构、192GB记忆体,AMD新资料中心GPU来了

导入CDNA3架构、192GB记忆体,AMD新资料中心GPU来了 相较于上一代产品MI250X,MI300X的运算单元数量增加幅度逼近40%(304个对上220个),记忆体容量达到1.5倍(192 GB HBM3对上128 GB HBM2e),记忆体最大频宽为1.7倍(5.3 TB/s对上3.2 TB/s);在资料型别上,MI300X可支援FP8与稀疏(sparsity)等数学计算,种种新增与强化特色,皆为了支撑AI与高效能运算类型的工作负载而来。 生成式 AI 就绪 英特尔发布第五代至强可扩展处理器 第五代英特尔 ® 至强 ® 可扩展处理器的核心数量增加至 64 个,配备了高达 320MB 的 L3 缓存和 128MB 的 L2 缓存。不论单核性能还是核心数量,它相比以往的至强都有了明显提升。在最终性能指标上,与上代产品相比,在相同功耗下平均性能提升 21%, 内存带宽提升高达 16%, 三级缓存容量提升到了原来的近 3 倍。;更为重要的是,第五代至强 ® 可扩展处理器的每个内核均具备 AI 加速功能,完全有能力处理要求严苛的 AI 工作负载。与上代相比,其训练性能提升多达 29%, 推理能力提升高达 42%。

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人