导入CDNA3架构、192GB记忆体,AMD新资料中心GPU来了

导入CDNA3架构、192GB记忆体,AMD新资料中心GPU来了https://www.ithome.com.tw/review/160523相较于上一代产品MI250X,MI300X的运算单元数量增加幅度逼近40%(304个对上220个),记忆体容量达到1.5倍(192GBHBM3对上128GBHBM2e),记忆体最大频宽为1.7倍(5.3TB/s对上3.2TB/s);在资料型别上,MI300X可支援FP8与稀疏(sparsity)等数学计算,种种新增与强化特色,皆为了支撑AI与高效能运算类型的工作负载而来。———生成式AI就绪英特尔发布第五代至强可扩展处理器https://www.ithome.com/0/741/410.htm第五代英特尔®至强®可扩展处理器的核心数量增加至64个,配备了高达320MB的L3缓存和128MB的L2缓存。不论单核性能还是核心数量,它相比以往的至强都有了明显提升。在最终性能指标上,与上代产品相比,在相同功耗下平均性能提升21%,内存带宽提升高达16%,三级缓存容量提升到了原来的近3倍。;更为重要的是,第五代至强®可扩展处理器的每个内核均具备AI加速功能,完全有能力处理要求严苛的AI工作负载。与上代相比,其训练性能提升多达29%,推理能力提升高达42%。

相关推荐

封面图片

英特尔至强"Emerald Rapids"CPU详细资料 比Sapphire Rapids快达40%

英特尔至强"EmeraldRapids"CPU详细资料比SapphireRapids快达40%这些幻灯片来自@InstLatX64发现的英特尔"以数据为中心的处理器路线图"演示文稿。由于缺少几个关键数据点,该演示文稿看起来还很不完整,但我们可以了解到代号为"翡翠急流"的第五代至强处理器阵容的一些额外信息。从细节入手,我们首先看到了第五代英特尔至强CPU的首张特写芯片照片,其中详细介绍了它的各个架构模块。EmeraldRapidsCPU基于RaptorCoveISA下的P-Core架构。旗舰芯片至强8592+拥有64个内核、128个线程和480MB三级缓存。如你所见,英特尔已从第四代蓝宝石急流处理器的4层设计转变为第五代翡翠急流处理器的2层设计。每个芯片组通过位于两个核心和高速缓存阵列之间的模块化芯片结构连接。每个阵列共有35个内核,其中每个芯片禁用3个内核。每个芯片组有2个内存控制器,支持速度高达5600MT/s的DDR5DIMM、3个PCIe控制器(共6个)、2个UPI(共4个)和2个加速器引擎(共4个)。据英特尔公司称,英特尔翡翠急流处理器将提供以下能力:更高的性能和性能/瓦通过更大的共享L3高速缓存增加核心数1类、2类和3类计算高速链路(CXL)更高的英特尔超路径互连速度(UPI)多达80个PCIeGen5通道英特尔加速器引擎内存速度提升第5代至强"翡翠急流"CPU的部分功能包括:高达3倍的LLC高速缓存更快的内存速度更多CPU内核数(最多64个内核)CXL类型3高带宽接口工作负载优化(英特尔AE)优化的电源模式通用性能/功耗最高提升17%利用英特尔加速器引擎卸载CPU内核,提高能效大幅提升推理和训练性能用于内置人工智能加速的英特尔AMX开箱即用的优化软件栈部署第五代至强"翡翠急流"CPU内嵌的加速器引擎提供了最新的AMX(高级矩阵扩展),并由一套利用优化开源框架和工具的可靠AI软件提供支持。英特尔还宣称,与第四代至强芯片相比,下一代至强芯片将提高总体拥有成本(TCO)和性能/美元收益,同时由于CPU与第四代SKU共用相同的插槽和平台,因此为客户提供了无缝升级途径。这就引出了下一个话题,即性能。在所有基准测试中,英特尔将第五代至强铂金版8592+(EmeraldRapids)64核CPU与第四代至强铂金版8480+(SapphireRapids)56核CPU进行了比较。数据中心特定任务和人工智能任务的性能提升如下:第5代至强8592+对第4代至强8480+基准测试:网络(服务器端Java吞吐量)=+20%高性能计算(LAMMPS-Copper)=+30%媒体(FFMPEGFPS转码)=+20%人工智能自然语言处理=+40%人工智能推荐系统=+40%需要注意的是,这些都是官方基准测试,要想获得更客观的结果,应等待第三方测试。虽然对于新产品来说,性能提升还算不错,但是否足以应对AMD基于Zen4和Zen4C架构的EPYC9004/8004产品线,我们拭目以待。英特尔的第五代翡翠急流CPU预计将于12月14日发布。...PC版:https://www.cnbeta.com.tw/articles/soft/1402219.htm手机版:https://m.cnbeta.com.tw/view/1402219.htm

封面图片

12月19日联想宣布,联想问天G3和联想ThinkSystemV3系列产品升级,将支持第五代英特尔至强可扩展处理器。首发第五代平

12月19日联想宣布,联想问天G3和联想ThinkSystemV3系列产品升级,将支持第五代英特尔至强可扩展处理器。首发第五代平台的联想问天WR5220G3服务器实现AI性能大幅提升:通用算力相同TDP下性能提升21%,每瓦性能提升10倍,人工智能性能提升高达14倍。英特尔第五代至强处理器是目前市场上唯一内置AI加速的数据中心处理器,其在大型模型推理和微调性能上的提升高达42%。同时,这也是MLPerf训练和推理基准测试中表现出色的CPU之一,能微调参数量多达200亿的大语言模型,并将推理性能提高42%。

封面图片

AMD公布AI加速卡路线图:紧随NVIDIA每年一更新 2025年就出CDNA4架构

AMD公布AI加速卡路线图:紧随NVIDIA每年一更新2025年就出CDNA4架构这款加速卡将配备高达288GB的HBM3E内存和6TB/s的内存带宽,提供1.3PFLOPs的FP16和2.6PFLOPs的FP8计算性能,能够处理高达1万亿参数的服务器。AMD还将在2025年推出的MI350系列,该系列将基于下一代CDNA4架构,并与OAM兼容。MI350系列将基于3nm工艺技术,同样提供高达288GB的HBM3E内存,并支持FP4/FP6数据类型。2026年,AMD计划推出基于全新CDNA架构,简称为"CDNANext"的MI400系列。在性能方面,CDNA3架构预计将比CDNA2提高8倍,而CDNA4架构预计将比CDNA3提供大约35倍的AI推理性能提升。AMD还分享了与NVIDIABlackwellB200GPU的比较数据,MI350系列预计将提供比B200多50%的内存和多20%的计算TFLOPs。AMD还重申了上周公布的UALink(UltraAcceleratorLink)的最新消息,这是一个由多家厂商包括微软、英特尔、思科、博通、Meta、惠普等共同开发的新型高性能、开放和可扩展的AI互连基础设施。...PC版:https://www.cnbeta.com.tw/articles/soft/1433341.htm手机版:https://m.cnbeta.com.tw/view/1433341.htm

封面图片

AMD Zen5 EPYC初露锋芒 128核完胜竞品256核

AMDZen5EPYC初露锋芒128核完胜竞品256核对于这样的对比,Intel方面自然是不服,特意撰文称对手刻意压低了自己产品的性能,并给出了不一样的数据。Intel首先表示,EmeraldRapids五代至强凭借AMXAI加速引擎,以及更多核心、更大缓存、更快内存,可以提供出色的AI性能,目前市面上没有敌手。硬件之上,Intel始终承诺推进AI开放软件,针对整个AI生态进行广泛优化,比如大语言模型推理深度优化之后的延迟相比PyTorch默认值降低了5倍。Intel指出,AMD对比中的至强铂金8592+成绩采用了未优化的软件和测试方式,性能偏低,比如对话部分的实际成绩能达到AMD宣称的接近5.5倍,从而可以领先TurinEPYC。Intel还进一步强调,AI的应用不只是大模型,比如在INT8整数类型上的各种深度学习推理上,四代和五代至强就都有着最优秀的性能,比如图像分类、自然语言处理等等,性能都可以完胜AMD现有的旗舰产品EPYC9754。AMDZen5架构的第五代EPYC风雨欲来之际,Intel已经发布了首次采用能效核的至强6SierraForest,后续还会推出采用性能核的至强6GraniteRidge。又一场大战就要开始了!就AI而言你看好哪边呢?...PC版:https://www.cnbeta.com.tw/articles/soft/1435086.htm手机版:https://m.cnbeta.com.tw/view/1435086.htm

封面图片

英特尔反驳 AMD 宣称其第 5 代 EPYC“Turin”处理器在 AI 负载任务性能方面胜于英特尔第 5 代至强处理器的论述

英特尔反驳AMD宣称其第5代EPYC“Turin”处理器在AI负载任务性能方面胜于英特尔第5代至强处理器的论述英特尔今日发文表示在聊天机器人场景中,第五代英特尔至强处理器性能相对于AMD高出5.4倍。软件优化后还有助于显著改善至强处理器在摘要和翻译场景中的表现不准确的情况,分别提高了2.3倍和1.2倍。此外,人工智能和深度学习的世界远不止于大型语言模型。第四代和第五代英特尔至强处理器在流行数据类型int8上的一系列深度学习推理中都击败了竞争对手的最新产品。关注频道@ZaiHuaPd频道爆料@ZaiHuabot

封面图片

AMD没有骗我 Zen5架构同频性能提升多达17%

AMD没有骗我Zen5架构同频性能提升多达17%虽然官方没有明说,但基本可以证实,锐龙AI9365是由4个Zen5、6个Zen5c混合组成的,前者最高频率5.0GHz,后者测试显示可达3.3GHz。对比对象是Zen3架构的锐龙77735U4.8GHz、Zen4架构的锐龙77840U5.1GHz。SPECCPU测试中,所有处理器的频率都固定在4.8GHz,实测显示Zen5对比Zen4、Zen3分别领先22.28%、9.71%。Zen5c3.3GHz的性能就没那么高了,只相当于Zen5的大约70%,但这也比Intel的能效核好得多,对比上代Zen4c则提升了超过10%。GeekBench6、GeekBench5测试中只跑单核性能,所有处理器使用默认频率,换算下来Zen5IPC的提升幅度分别为115.28%、117.66%,这和AMD宣称的非常接近。...PC版:https://www.cnbeta.com.tw/articles/soft/1435825.htm手机版:https://m.cnbeta.com.tw/view/1435825.htm

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人