AMD Zen5性能暴涨40%的秘密:独享AVX-512指令集大升级

AMD Zen5性能暴涨40%的秘密:独享AVX-512指令集大升级 Zen4架构的AVX-512指令集是通过两个256位FPU浮点单元来组合执行的,可以更灵活一些,功耗也更低,但性能达不到极致。Zen5架构将会引入512位FPU单元,可以直接执行AVX-512,性能更强,也可高效执行VNNI等指令,更有利于提升AI表现。为此,Zen5架构也会在其他方面升级配合,方便喂给FPU单元足够的数据和指令。比如增大一级缓存DTLB,一级数据缓存容量从32KB增大到48KB,比如载入存储队列加宽,比如FPU MADD延迟缩短一个时钟周期,等等。此外,Zen5架构的整数执行流水线也会从8条增加到10条。不过,二级缓存容量保持不变,每核心还是1MB。 ... PC版: 手机版:

相关推荐

封面图片

AVX-512加持 AMD Zen5旗舰锐龙9 9950X理论跑分暴涨45%

AVX-512加持 AMD Zen5旗舰锐龙9 9950X理论跑分暴涨45% 测试中,锐龙9 9950X搭配的是双通道DDR5-8000,时序为34-45-40-42。AES加密测试中,锐龙9 9950X跑出了746991MB/s的惊人成绩,对比现有旗舰锐龙9 7950X提升了多达45%,更是领先i9-13900K 55%至多(14900K/14900KS都是超频版也不会差多少),甚至比32核心的线程撕裂者7975WX都高出了11%。FP32单精度、FP64双精度浮点测试中,锐龙9 9950X对比7950X、13900K的优势分别也有39%、60%,即便面对7975WX也只落后13%、16%。 当然,这里不能不提一个重要因素:AVX-512。AMD Zen4架构开始支持这一原本属于Intel的独门绝技,但因为大小核混合架构设计,Intel反而失去了它。 ... PC版: 手机版:

封面图片

AMD没有骗我 Zen5架构同频性能提升多达17%

AMD没有骗我 Zen5架构同频性能提升多达17% 虽然官方没有明说,但基本可以证实,锐龙AI 9 365是由4个Zen5、6个Zen5c混合组成的,前者最高频率5.0GHz,后者测试显示可达3.3GHz。对比对象是Zen3架构的锐龙7 7735U 4.8GHz、Zen4架构的锐龙7 7840U 5.1GHz。SPEC CPU测试中,所有处理器的频率都固定在4.8GHz,实测显示Zen5对比Zen4、Zen3分别领先22.28%、9.71%。Zen5c 3.3GHz的性能就没那么高了,只相当于Zen5的大约70%,但这也比Intel的能效核好得多,对比上代Zen4c则提升了超过10%。GeekBench 6、GeekBench 5测试中只跑单核性能,所有处理器使用默认频率,换算下来Zen5 IPC的提升幅度分别为115.28%、117.66%,这和AMD宣称的非常接近。 ... PC版: 手机版:

封面图片

AMD官方确认:Zen5架构下半年见 三线同时出击

AMD官方确认:Zen5架构下半年见 三线同时出击 Zen5的桌面版Granite Ridge没有明确提及,但肯定也会在今年晚些时候登场,形成新一代三驾马车。而到了明年初,还会有同样Zen5架构,但是更强大的顶级移动版Stirx Halo。苏姿丰表示,对于AI PC产品而言,Strix系列非常适合高端市场,而到了2025年,大家会看到(Zen5)会普及到整个产品线。从目前的曝料看,Strix Point会有最多12个CPU核心,包括4个Zen5、8个Zen5c,还有16个RDNA3+ GPU单元、XDNA2 NPU单元。Strix Halo会有6-16个Zen5 CPU核心、20-40个RDNA3 GPU核心,甚至有说法称40个单元的性能最高可媲美移动版RTX 4070,32、24个单元的分别可以相当于移动版RTX 4060/4050。 ... PC版: 手机版:

封面图片

AMD Zen 5执行引擎泄露 采用真正的512位FPU

AMD Zen 5执行引擎泄露 采用真正的512位FPU 目前,AMD 在 "Zen 4 "上使用双泵送 256 位 FPU 来执行 AVX-512 工作负载。更新后的 FPU 将大大提高内核在利用 512 位 AVX 或 VNNI 指令的工作负载(如人工智能)中的性能。 为 "Zen 5 "提供 512 位 FPU 意味着 AMD 还必须扩大辅助设备的规模所有为 FPU 提供数据和指令的组件。因此,公司增加了 L1 DTLB 的容量。加载-存储队列已经扩大,以满足新 FPU 的需要。L1 数据高速缓存的带宽增加了一倍,大小增加了 50%。L1D 的大小从 "Zen 4 "的 32 KB 增加到现在的 48 KB。FPU MADD 延迟时间缩短了 1 个周期。除了 FPU,AMD 还将整数执行管道的数量从 "Zen 4 "的 8 个增加到 10 个。每个内核的独占二级缓存大小仍为 1 MB。 ... PC版: 手机版:

封面图片

AMD Zen5越来越近 Linux GCC编译器已支持

AMD Zen5越来越近 Linux GCC编译器已支持 目前已支持的新指令集有:AVXVNNI、MOVDIRI、MOVDIR64B、AVX512VP2INTERSECT、PREFETCHI。后续,AMD还会不断更新更多优化与增强,让开发者可以提前熟悉并利用Zen5的新技术特性。Zen5首发产品预计是代号Stirx Point的新一代锐龙8050系列主流笔记本处理器,大概率在台北电脑展上官宣,使用Zen5/5c混合架构和RDNA 3.5 GPU。后续还有面向高端桌面和游戏本的Granite Ridge,Zen5 CPU搭档RDNA2 GPU。明年会有集成3D缓存的桌面版Granite Ridge、移动版Fire Range,以及面向轻薄本的Strix Halo,后者也是Zen5/5c、RDNA3.5。至于Turin EPYC,肯定也得等明年了。 ... PC版: 手机版:

封面图片

AMD Zen5单核性能飙升40%+ 重现初代Zen的辉煌

AMD Zen5单核性能飙升40%+ 重现初代Zen的辉煌 根据靠谱曝料高手“Kepler_L2”的最新说法,SPEC基准测试中,Zen5架构相比于Zen4的单核性能提升可超过40%。看起来,这个提升应该是工艺、架构、频率三方面综合的结果,但是IPC的提升幅度必然也不会小,毕竟工艺方面已经难有翻天覆地的变化,频率也不太可能大幅提高。另一方面,这个超40%的提升幅度不知道是平均值,还是最高值,如果是前者那就更让人亢奋了。这不由得让人想起了第一代Zen,官方设定的目标是IPC相比于挖掘机架构提升40%,最后竟然做到了52%当然也是因为挖掘机太弱了。Zen5锐龙已经开始周转测试,其中桌面端代号Granite Ridge,估计得等到第三甚至第四季度才会发布,最多16核心,最高TDP 170W。移动端今年晚些时候首发Stirx Point,最多4个Zen5加8个Zen5c核心、16个RDNA3+ GPU核心,TDP 28-54W。明年还有高端的Fire Range,移植自桌面版Granite Ridge,TDP控制到55-75W。还有个终极的Strix Halo,最多16个Zen5、40个RDNA3+ GPU核心,TDP 55-120W。 ... PC版: 手机版:

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人