AMD Zen 5 执行引擎曝光：采用真正的 512-bit FPU

AMD Zen 5执行引擎泄露采用真正的512位FPU

AMD Zen 5执行引擎泄露采用真正的512位FPU 目前，AMD 在 "Zen 4 "上使用双泵送 256 位 FPU 来执行 AVX-512 工作负载。更新后的 FPU 将大大提高内核在利用 512 位 AVX 或 VNNI 指令的工作负载（如人工智能）中的性能。为 "Zen 5 "提供 512 位 FPU 意味着 AMD 还必须扩大辅助设备的规模所有为 FPU 提供数据和指令的组件。因此，公司增加了 L1 DTLB 的容量。加载-存储队列已经扩大，以满足新 FPU 的需要。L1 数据高速缓存的带宽增加了一倍，大小增加了 50%。L1D 的大小从 "Zen 4 "的 32 KB 增加到现在的 48 KB。FPU MADD 延迟时间缩短了 1 个周期。除了 FPU，AMD 还将整数执行管道的数量从 "Zen 4 "的 8 个增加到 10 个。每个内核的独占二级缓存大小仍为 1 MB。 ... PC版：手机版：

AMD Zen5性能暴涨40％的秘密：独享AVX-512指令集大升级

AMD Zen5性能暴涨40％的秘密：独享AVX-512指令集大升级 Zen4架构的AVX-512指令集是通过两个256位FPU浮点单元来组合执行的，可以更灵活一些，功耗也更低，但性能达不到极致。Zen5架构将会引入512位FPU单元，可以直接执行AVX-512，性能更强，也可高效执行VNNI等指令，更有利于提升AI表现。为此，Zen5架构也会在其他方面升级配合，方便喂给FPU单元足够的数据和指令。比如增大一级缓存DTLB，一级数据缓存容量从32KB增大到48KB，比如载入存储队列加宽，比如FPU MADD延迟缩短一个时钟周期，等等。此外，Zen5架构的整数执行流水线也会从8条增加到10条。不过，二级缓存容量保持不变，每核心还是1MB。 ... PC版：手机版：

AVX-512加持 AMD Zen5旗舰锐龙9 9950X理论跑分暴涨45％

AVX-512加持 AMD Zen5旗舰锐龙9 9950X理论跑分暴涨45％测试中，锐龙9 9950X搭配的是双通道DDR5-8000，时序为34-45-40-42。AES加密测试中，锐龙9 9950X跑出了746991MB/s的惊人成绩，对比现有旗舰锐龙9 7950X提升了多达45％，更是领先i9-13900K 55％至多(14900K/14900KS都是超频版也不会差多少)，甚至比32核心的线程撕裂者7975WX都高出了11％。FP32单精度、FP64双精度浮点测试中，锐龙9 9950X对比7950X、13900K的优势分别也有39％、60％，即便面对7975WX也只落后13％、16％。当然，这里不能不提一个重要因素：AVX-512。AMD Zen4架构开始支持这一原本属于Intel的独门绝技，但因为大小核混合架构设计，Intel反而失去了它。 ... PC版：手机版：

LLM Runner Llamafile更新为Ryzen AVX-512 CPU带来10倍性能提升

LLM Runner Llamafile更新为Ryzen AVX-512 CPU带来10倍性能提升据悉，AMD 的 Zen 4"Ryzen"CPU 在使用新更新后，提示评估速度将提高十倍，最终使该工具的 LLM 性能更加高效。对于不了解 Llamafile 的人来说，它只需部署一个可执行文件，将 LLM 模型与运行该模型所需的库结合在一起即可。Mozilla Ocho 开发了这一工具，旨在通过利用 CPU 和 GPU 的执行能力，让更多人了解 LLM。不过，Llamafile的开发仍处于早期阶段，因此还存在一些不准确的地方，我们相信一旦边缘计算的发展势头强劲，这些问题很快就会得到解决。你可以通过 GitHub 访问最新版本。请注意，AMD 的 Ryzen CPU 是唯一支持 AVX-512 指令的消费级芯片，而英特尔已经放弃了对它的支持，因为害怕这会影响其至强芯片的销售。这使得 AMD 的 Ryzen 平台对于希望运行 AVX-512 应用程序的用户来说更具优势。 ... PC版：手机版：

Qubic加密货币挖矿热潮导致AMD Ryzen 9 7950X经销商库存快速下降

Qubic加密货币挖矿热潮导致AMD Ryzen 9 7950X经销商库存快速下降盈利能力计算器显示，在扣除以默认 170 W TDP 运行芯片所需的能耗成本后，在 AMD Ryzen 9 7950X 16 核处理器上进行 24 小时 Qubic 挖矿的成本约为 3 美元。像 7950X 这样的"Zen 4"处理器，将频率控制在较低水平也能保持大部分挖矿性能，并降低功耗限制，这可以保持或提高利润率，同时还能延长硬件的使用寿命。于是，不可避免的事情发生了AMD Ryzen 9 7950X 的库存一夜之间在网上零售店消失殆尽。由于 7950X3D 和英特尔酷睿 i9-14900K 的市场存在，7950X 的价格通常在 550-600 美元之间，考虑到其较低的投入成本，7950X 本应具有很高的附加值。基于 CPU 的加密货币矿机，包括 QBIC 矿机，似乎都在利用 AVX-512 指令集。AMD 的"Zen 4"微架构通过其双泵送 256 位 FPU 支持 AVX-512，而即将推出的"Zen 5"微架构据传会将 AVX-512 性能比"Zen 4"提高一倍。与此同时，英特尔自第 12 代"Alder Lake"处理器以来，已经淘汰了其酷睿处理器中为数不多的与客户相关的 AVX-512 指令，因为据说这影响了至强处理器的销售。那么，缓存大很多的7950X3D 怎么样？它的价格更高，但挖矿并不能从 3D V-cache 中获益，而且该芯片也不能像 7950X 那样在所有 16 个内核中都能维持 CPU 时钟。7950X3D 的消失也只是时间问题；随后是 12 核心型号，如 65 W 7900、170 W 7900X 和 7900X3D。 ... PC版：手机版：

AMD Zen5越来越近 Linux GCC编译器已支持

AMD Zen5越来越近 Linux GCC编译器已支持目前已支持的新指令集有：AVXVNNI、MOVDIRI、MOVDIR64B、AVX512VP2INTERSECT、PREFETCHI。后续，AMD还会不断更新更多优化与增强，让开发者可以提前熟悉并利用Zen5的新技术特性。Zen5首发产品预计是代号Stirx Point的新一代锐龙8050系列主流笔记本处理器，大概率在台北电脑展上官宣，使用Zen5/5c混合架构和RDNA 3.5 GPU。后续还有面向高端桌面和游戏本的Granite Ridge，Zen5 CPU搭档RDNA2 GPU。明年会有集成3D缓存的桌面版Granite Ridge、移动版Fire Range，以及面向轻薄本的Strix Halo，后者也是Zen5/5c、RDNA3.5。至于Turin EPYC，肯定也得等明年了。 ... PC版：手机版：