Intel引以为傲的AVX-512指令集被AMD打得一败涂地

Intel引以为傲的AVX-512指令集被AMD打得一败涂地Intel新发布的第四代可扩展至强当然也支持AVX-512,但毕竟是传统技能,Intel几乎没怎么提及,谈论更多的是新引入的AMX指令集。Phoronix就针对AVX-512指令集做了一次有趣的测试,参测三颗旗舰级处理器分别是:至强8380:IceLake架构,10nm工艺,40核心80线程,三级缓存60MB,频率2.3-3.4GHz,TDP270W。至强8490H:SapphireRapids架构u,Intel7工艺,60核心120线程,三级缓存112.5MB,TDP350W。霄龙9654:Zen4架构,5nm工艺,96核心192线程,三级缓存384MB,TDP360W(可调范围320-400W)。三者开启AVX-512指令集后,平均性能提升幅度分别为34.1%、44.2%、20.7%,Intel处理器上果然有更好的加持,尤其是四代至强上。但是,四代至强即便开启AVX-512,也只是勉强超过霄龙9000,而后者打开AVX-512,可以轻松领先接近20%!AMD用Intel的“魔法”打败Intel,这就有趣了。...PC版:https://www.cnbeta.com.tw/articles/soft/1340203.htm手机版:https://m.cnbeta.com.tw/view/1340203.htm

相关推荐

封面图片

Intel AVX-512指令集复活 小核心终于也能跑了

IntelAVX-512指令集复活小核心终于也能跑了基本层面上,大核可以完整执行256/512位指令,小核则只能执行融合256位指令(可以粗略理解为支持到AVX-256)。更深层面上,AVX10可以说是AVX-512的超集,不但包含所有的AVX-512指令,对应的功能标识为AVX-512VL,还有256位的矢量寄存器、八个32位的掩码寄存器、支持嵌入式舍入的新版256位指令。其中,P大核可以可以使用512位矢量,E小核则限制在256位矢量长度。AVX10推出后,AVX-512也将彻底冻结,不会再有变化,未来对于它的使用都通过AVX10来实现。Intel强调,现有应用基于AVX-512、AVX10的性能是一样的,至少在同等矢量长度下没有区别。AVX2编译的程序,重新编译支持AVX10,会获得性能提升,且无需再次对软件调优。对矢量寄存器压力敏感的AVX2程序,获得的性能提升最明显,这要感谢额外的16个矢量寄存器和新的指令。高度线程化的矢量化应用在E核上运行时,可获得更高的总吞吐量。Intel下一代消费级酷睿处理器是MeteorLake,依然不会有AVX-512,再下一代的ArrowLake是否会首次加入AVX10,尚不确认。今年底,Intel将推出第五代可扩展至强EmeraldRapids,只是现有第四代SapphireRapids的升级版,因此要到明年的第六代至强GraniteRapids,才会加入AVX10。至于明年首款纯小核设计的SierraForest,是否也会加入AVX10,暂时不清楚。不过,AVX10的落地分为两步,第一步是AVX10.1,用于六代至强GraniteRapids,仅支持512位矢量指令,而不支持融合256位矢量指令。第二步是AVX10.2,应该用于七代至强ClearwaterForest,加入融合256位矢量指令,并加入其他新功能,比如AI数据类型和转换、数据转移优化等等。...PC版:https://www.cnbeta.com.tw/articles/soft/1372993.htm手机版:https://m.cnbeta.com.tw/view/1372993.htm

封面图片

AMD Zen4有了AVX-512指令集 性能暴增2.5倍

AMDZen4有了AVX-512指令集性能暴增2.5倍AMDZen4架构的锐龙7000系列将首次支持IntelAVX-512,虽然只是一部分而不是完全体,但也是个重大突破,尤其是Intel12/13代酷睿因为混合架构反而不能开启这一指令集,更先得非比寻常。AVX-512已经诞生很多年,但应用范围一直不大,普通玩家最熟悉的大概就是极限烤机时的超高功耗了。按照AMD的官方说法,Zen4AVX-512指令集主要用于AI、HPC应用加速,FP32浮点推理多线程性能可提升最多1.3倍,INT8整数推理多线程性能可提升最多2.5倍。来自RiotGames的图形工程师Joey(Wunkolo)对于AMDZen4AVX-512指令集的支持非常感兴趣,在一系列模拟器中已经加入了相应的优化。具体包括:Switch模拟器Yuzu、3DS模拟器Citra、PSVita模拟器Vita3K、Xbox360模拟器Xenia。如果使用锐龙7000系列平台运行这些模拟器,将带来极为明显的性能提升,但具体提升幅度没说。根据经验,12代酷睿最初还能用AVX-512的时候,PS3模拟器RPCS3的性能提升了最多30%,但随后,Intel就把12代酷睿的AVX-512给强行屏蔽了。PC版:https://www.cnbeta.com/articles/soft/1312687.htm手机版:https://m.cnbeta.com/view/1312687.htm

封面图片

AMD Zen4锐龙7000补丁正式开启AVX-512指令集

AMDZen4锐龙7000补丁正式开启AVX-512指令集AMD锐龙7000系列不但带来了5nm工艺、Zen4架构、RDNA2GPU核心、DDR5内存、PCIe5.0总线、AM5接口,还首次加入了AVX-512指令集,这在之前可是Intel的独门绝技。近日,AMD更新了LinuxGCC编译器的基础代码,相当于为新的Zenver4打了个小补丁,加入了对AVX-512指令集的支持。PC版:https://www.cnbeta.com/articles/soft/1328443.htm手机版:https://m.cnbeta.com/view/1328443.htm

封面图片

AMD Zen5性能暴涨40%的秘密:独享AVX-512指令集大升级

AMDZen5性能暴涨40%的秘密:独享AVX-512指令集大升级Zen4架构的AVX-512指令集是通过两个256位FPU浮点单元来组合执行的,可以更灵活一些,功耗也更低,但性能达不到极致。Zen5架构将会引入512位FPU单元,可以直接执行AVX-512,性能更强,也可高效执行VNNI等指令,更有利于提升AI表现。为此,Zen5架构也会在其他方面升级配合,方便喂给FPU单元足够的数据和指令。比如增大一级缓存DTLB,一级数据缓存容量从32KB增大到48KB,比如载入存储队列加宽,比如FPUMADD延迟缩短一个时钟周期,等等。此外,Zen5架构的整数执行流水线也会从8条增加到10条。不过,二级缓存容量保持不变,每核心还是1MB。...PC版:https://www.cnbeta.com.tw/articles/soft/1426603.htm手机版:https://m.cnbeta.com.tw/view/1426603.htm

封面图片

RPCS3模拟器开始支持AMD Ryzen 7000"Zen 4"AVX-512指令集

RPCS3模拟器开始支持AMDRyzen7000"Zen4"AVX-512指令集索尼PS3模拟器"RPCSE3"的最新版本现在已经更新,以支持AMDRyzen7000"Zen4"CPU的AVX-512指令。带有AVX-512指令的AMDRyzen7000"Zen4"CPU现在可以提升索尼PS3"RPCS3"模拟器的性能。PC版:https://www.cnbeta.com/articles/soft/1322325.htm手机版:https://m.cnbeta.com/view/1322325.htm

封面图片

AVX-512指令立奇功 AMD Zen4基准性能飙升31%

AVX-512指令立奇功AMDZen4基准性能飙升31%反倒是AMDZen4架构的锐龙7000系列首次加入了AVX-512,可以获得各种加速,AI、HPC应用都能获益匪浅。y-cruncher的开发者AlexanderYee从三年前就开始开发全新的0.8x版本,新增、修改了超过40万行代码,让程序更加精炼、高效,对比现在的0.7.10版本在几乎所有处理器上都有性能提升。比如说锐龙97950X,得益于AVX-512GFNI指令,性能可提升多达23-31%,而同样支持该指令的i7-1165G7、i7-11800H,也能分别提速12-22%、23-27%。Intel、AMD的其他老处理器,凭借AVX2指令集,也能获得10%左右不等的性能提升。但太老的就不行了,2008年的Nahalemi7-920因为仅支持SSE4.1指令集,性能反而会暴跌27%。2012年二代酷睿的i7-3630QM只有第一代AVX指令集,性能也会损失10%。同一年的打桩机架构FX-8350,只有FMA4指令集,性能也会稍微下降1%。有消息称,AVX-512指令集将在未来的Intel消费级处理器上回归。只是,这还需要一些时间,具体在哪一代产品上成真还未可知,反正MeteorLake14代绝对没戏,ArrowLake15代可能性也不大。...PC版:https://www.cnbeta.com.tw/articles/soft/1364069.htm手机版:https://m.cnbeta.com.tw/view/1364069.htm

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人