AMD Zen 5 执行引擎曝光:采用真正的 512-bit FPU

AMD Zen 5 执行引擎曝光:采用真正的 512-bit FPU Zen 4 处理器在执行 AVX-512 指令工作负载的时候,使用的是双路 256-bit FPU,而在 Zen 5 将使用真正的 512-bit FPU,在处理 512-bit AVX 或者 VNNI 指令方面会有更高的性能表现。

相关推荐

封面图片

AMD Zen 5执行引擎泄露 采用真正的512位FPU

AMD Zen 5执行引擎泄露 采用真正的512位FPU 目前,AMD 在 "Zen 4 "上使用双泵送 256 位 FPU 来执行 AVX-512 工作负载。更新后的 FPU 将大大提高内核在利用 512 位 AVX 或 VNNI 指令的工作负载(如人工智能)中的性能。 为 "Zen 5 "提供 512 位 FPU 意味着 AMD 还必须扩大辅助设备的规模所有为 FPU 提供数据和指令的组件。因此,公司增加了 L1 DTLB 的容量。加载-存储队列已经扩大,以满足新 FPU 的需要。L1 数据高速缓存的带宽增加了一倍,大小增加了 50%。L1D 的大小从 "Zen 4 "的 32 KB 增加到现在的 48 KB。FPU MADD 延迟时间缩短了 1 个周期。除了 FPU,AMD 还将整数执行管道的数量从 "Zen 4 "的 8 个增加到 10 个。每个内核的独占二级缓存大小仍为 1 MB。 ... PC版: 手机版:

封面图片

AMD Zen5性能暴涨40%的秘密:独享AVX-512指令集大升级

AMD Zen5性能暴涨40%的秘密:独享AVX-512指令集大升级 Zen4架构的AVX-512指令集是通过两个256位FPU浮点单元来组合执行的,可以更灵活一些,功耗也更低,但性能达不到极致。Zen5架构将会引入512位FPU单元,可以直接执行AVX-512,性能更强,也可高效执行VNNI等指令,更有利于提升AI表现。为此,Zen5架构也会在其他方面升级配合,方便喂给FPU单元足够的数据和指令。比如增大一级缓存DTLB,一级数据缓存容量从32KB增大到48KB,比如载入存储队列加宽,比如FPU MADD延迟缩短一个时钟周期,等等。此外,Zen5架构的整数执行流水线也会从8条增加到10条。不过,二级缓存容量保持不变,每核心还是1MB。 ... PC版: 手机版:

封面图片

AVX-512加持 AMD Zen5旗舰锐龙9 9950X理论跑分暴涨45%

AVX-512加持 AMD Zen5旗舰锐龙9 9950X理论跑分暴涨45% 测试中,锐龙9 9950X搭配的是双通道DDR5-8000,时序为34-45-40-42。AES加密测试中,锐龙9 9950X跑出了746991MB/s的惊人成绩,对比现有旗舰锐龙9 7950X提升了多达45%,更是领先i9-13900K 55%至多(14900K/14900KS都是超频版也不会差多少),甚至比32核心的线程撕裂者7975WX都高出了11%。FP32单精度、FP64双精度浮点测试中,锐龙9 9950X对比7950X、13900K的优势分别也有39%、60%,即便面对7975WX也只落后13%、16%。 当然,这里不能不提一个重要因素:AVX-512。AMD Zen4架构开始支持这一原本属于Intel的独门绝技,但因为大小核混合架构设计,Intel反而失去了它。 ... PC版: 手机版:

封面图片

LLM Runner Llamafile更新为Ryzen AVX-512 CPU带来10倍性能提升

LLM Runner Llamafile更新为Ryzen AVX-512 CPU带来10倍性能提升 据悉,AMD 的 Zen 4"Ryzen"CPU 在使用新更新后,提示评估速度将提高十倍,最终使该工具的 LLM 性能更加高效。对于不了解 Llamafile 的人来说,它只需部署一个可执行文件,将 LLM 模型与运行该模型所需的库结合在一起即可。Mozilla Ocho 开发了这一工具,旨在通过利用 CPU 和 GPU 的执行能力,让更多人了解 LLM。不过,Llamafile的开发仍处于早期阶段,因此还存在一些不准确的地方,我们相信一旦边缘计算的发展势头强劲,这些问题很快就会得到解决。你可以通过 GitHub 访问最新版本。请注意,AMD 的 Ryzen CPU 是唯一支持 AVX-512 指令的消费级芯片,而英特尔已经放弃了对它的支持,因为害怕这会影响其至强芯片的销售。这使得 AMD 的 Ryzen 平台对于希望运行 AVX-512 应用程序的用户来说更具优势。 ... PC版: 手机版:

封面图片

Qubic加密货币挖矿热潮导致AMD Ryzen 9 7950X经销商库存快速下降

Qubic加密货币挖矿热潮导致AMD Ryzen 9 7950X经销商库存快速下降 盈利能力计算器显示,在扣除以默认 170 W TDP 运行芯片所需的能耗成本后,在 AMD Ryzen 9 7950X 16 核处理器上进行 24 小时 Qubic 挖矿的成本约为 3 美元。像 7950X 这样的"Zen 4"处理器,将频率控制在较低水平也能保持大部分挖矿性能,并降低功耗限制,这可以保持或提高利润率,同时还能延长硬件的使用寿命。于是,不可避免的事情发生了AMD Ryzen 9 7950X 的库存一夜之间在网上零售店消失殆尽。由于 7950X3D 和英特尔酷睿 i9-14900K 的市场存在,7950X 的价格通常在 550-600 美元之间,考虑到其较低的投入成本,7950X 本应具有很高的附加值。基于 CPU 的加密货币矿机,包括 QBIC 矿机,似乎都在利用 AVX-512 指令集。AMD 的"Zen 4"微架构通过其双泵送 256 位 FPU 支持 AVX-512,而即将推出的"Zen 5"微架构据传会将 AVX-512 性能比"Zen 4"提高一倍。与此同时,英特尔自第 12 代"Alder Lake"处理器以来,已经淘汰了其酷睿处理器中为数不多的与客户相关的 AVX-512 指令,因为据说这影响了至强处理器的销售。那么,缓存大很多的7950X3D 怎么样?它的价格更高,但挖矿并不能从 3D V-cache 中获益,而且该芯片也不能像 7950X 那样在所有 16 个内核中都能维持 CPU 时钟。7950X3D 的消失也只是时间问题;随后是 12 核心型号,如 65 W 7900、170 W 7900X 和 7900X3D。 ... PC版: 手机版:

封面图片

AMD Zen5越来越近 Linux GCC编译器已支持

AMD Zen5越来越近 Linux GCC编译器已支持 目前已支持的新指令集有:AVXVNNI、MOVDIRI、MOVDIR64B、AVX512VP2INTERSECT、PREFETCHI。后续,AMD还会不断更新更多优化与增强,让开发者可以提前熟悉并利用Zen5的新技术特性。Zen5首发产品预计是代号Stirx Point的新一代锐龙8050系列主流笔记本处理器,大概率在台北电脑展上官宣,使用Zen5/5c混合架构和RDNA 3.5 GPU。后续还有面向高端桌面和游戏本的Granite Ridge,Zen5 CPU搭档RDNA2 GPU。明年会有集成3D缓存的桌面版Granite Ridge、移动版Fire Range,以及面向轻薄本的Strix Halo,后者也是Zen5/5c、RDNA3.5。至于Turin EPYC,肯定也得等明年了。 ... PC版: 手机版:

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人