AMD Zen 5执行引擎泄露 采用真正的512位FPU

AMD Zen 5执行引擎泄露 采用真正的512位FPU 目前,AMD 在 "Zen 4 "上使用双泵送 256 位 FPU 来执行 AVX-512 工作负载。更新后的 FPU 将大大提高内核在利用 512 位 AVX 或 VNNI 指令的工作负载(如人工智能)中的性能。 为 "Zen 5 "提供 512 位 FPU 意味着 AMD 还必须扩大辅助设备的规模所有为 FPU 提供数据和指令的组件。因此,公司增加了 L1 DTLB 的容量。加载-存储队列已经扩大,以满足新 FPU 的需要。L1 数据高速缓存的带宽增加了一倍,大小增加了 50%。L1D 的大小从 "Zen 4 "的 32 KB 增加到现在的 48 KB。FPU MADD 延迟时间缩短了 1 个周期。除了 FPU,AMD 还将整数执行管道的数量从 "Zen 4 "的 8 个增加到 10 个。每个内核的独占二级缓存大小仍为 1 MB。 ... PC版: 手机版:

相关推荐

封面图片

AMD Zen 5 执行引擎曝光:采用真正的 512-bit FPU

AMD Zen 5 执行引擎曝光:采用真正的 512-bit FPU Zen 4 处理器在执行 AVX-512 指令工作负载的时候,使用的是双路 256-bit FPU,而在 Zen 5 将使用真正的 512-bit FPU,在处理 512-bit AVX 或者 VNNI 指令方面会有更高的性能表现。

封面图片

AMD Zen5性能暴涨40%的秘密:独享AVX-512指令集大升级

AMD Zen5性能暴涨40%的秘密:独享AVX-512指令集大升级 Zen4架构的AVX-512指令集是通过两个256位FPU浮点单元来组合执行的,可以更灵活一些,功耗也更低,但性能达不到极致。Zen5架构将会引入512位FPU单元,可以直接执行AVX-512,性能更强,也可高效执行VNNI等指令,更有利于提升AI表现。为此,Zen5架构也会在其他方面升级配合,方便喂给FPU单元足够的数据和指令。比如增大一级缓存DTLB,一级数据缓存容量从32KB增大到48KB,比如载入存储队列加宽,比如FPU MADD延迟缩短一个时钟周期,等等。此外,Zen5架构的整数执行流水线也会从8条增加到10条。不过,二级缓存容量保持不变,每核心还是1MB。 ... PC版: 手机版:

封面图片

AVX-512加持 AMD Zen5旗舰锐龙9 9950X理论跑分暴涨45%

AVX-512加持 AMD Zen5旗舰锐龙9 9950X理论跑分暴涨45% 测试中,锐龙9 9950X搭配的是双通道DDR5-8000,时序为34-45-40-42。AES加密测试中,锐龙9 9950X跑出了746991MB/s的惊人成绩,对比现有旗舰锐龙9 7950X提升了多达45%,更是领先i9-13900K 55%至多(14900K/14900KS都是超频版也不会差多少),甚至比32核心的线程撕裂者7975WX都高出了11%。FP32单精度、FP64双精度浮点测试中,锐龙9 9950X对比7950X、13900K的优势分别也有39%、60%,即便面对7975WX也只落后13%、16%。 当然,这里不能不提一个重要因素:AVX-512。AMD Zen4架构开始支持这一原本属于Intel的独门绝技,但因为大小核混合架构设计,Intel反而失去了它。 ... PC版: 手机版:

封面图片

AMD Zen5越来越近 Linux GCC编译器已支持

AMD Zen5越来越近 Linux GCC编译器已支持 目前已支持的新指令集有:AVXVNNI、MOVDIRI、MOVDIR64B、AVX512VP2INTERSECT、PREFETCHI。后续,AMD还会不断更新更多优化与增强,让开发者可以提前熟悉并利用Zen5的新技术特性。Zen5首发产品预计是代号Stirx Point的新一代锐龙8050系列主流笔记本处理器,大概率在台北电脑展上官宣,使用Zen5/5c混合架构和RDNA 3.5 GPU。后续还有面向高端桌面和游戏本的Granite Ridge,Zen5 CPU搭档RDNA2 GPU。明年会有集成3D缓存的桌面版Granite Ridge、移动版Fire Range,以及面向轻薄本的Strix Halo,后者也是Zen5/5c、RDNA3.5。至于Turin EPYC,肯定也得等明年了。 ... PC版: 手机版:

封面图片

Zen架构大获成功 AMD EPYC服务器及数据中心市占率达23.1%

Zen架构大获成功 AMD EPYC服务器及数据中心市占率达23.1% 整个消费性市场AMD出货量占比为20.2%,相较前一年同期提升多达3.1%,相较前一季增加了0.8%。若照营收计算,AMD仅占15.4%,相较前一年同期增加2.1%,相较前一季却下滑了1.5%。服务器及数据中心部分,AMD EPYC则是真正的大丰收,目前已拿下23.1%市占率,是三大细分领域中最高的,且相较前一年同期提升高达5.5%。更进一步,EPYC的AMD收入占比已高达31.1%,相较前一年同期增加了4.4%。服务器市场AMD市占一度基本为零,2017年Zen架构诞生后即一路突飞猛进、势不可挡,无论是效能亦或性价比皆对标英特尔Xeon。从历史趋势来看,Zen架构确实堪称AMD史上最成功的产品,一路带领AMD三线齐飞,仅有消费性市场于2022年出现了一次大跌,随后即慢慢恢复,服务器市场则是一直攻城掠地。 ... PC版: 手机版:

封面图片

AMD Zen 6的每个CCD最多可容纳32个CPU核心

AMD Zen 6的每个CCD最多可容纳32个CPU核心 PYC"Bergamo"处理器中目前使用的纯"Zen 4c"CCD包含两个8核CCX(CPU内核复合体)的16个内核,CCX内的8个内核共享16 MB L3高速缓存。即将推出的"Zen 5c"CCD将包含16个内核,但在单个16核CCX中,16个内核共享32 MB L3高速缓存,以改善每个内核的高速缓存访问。预计"Zen 6"将把每个 CCD 的内核数增加一倍,达到 32 个。由"Zen 6"(可能是 Zen 6c)驱动的 32 核 CCD 可能会利用工艺改进的优势,将内核数增加一倍。目前还不清楚这款巨型 CCD 是采用单个大型 CCX,所有 32 个内核共享一个大型 L3 高速缓存;还是采用两个 16 核 CCX,16 个内核共享 32 MB L3 高速缓存。不过,这次泄露的信息表明,AMD 希望继续增加每个插槽的 CPU 内核数量。数据中心和云计算客户似乎很喜欢这一点,而 AMD 是唯一一家与 Ampere 等基于 Arm 的服务器处理器制造商展开激烈竞争的 x86 处理器制造商,每一代产品都会大幅增加单个插槽的内核数量。 ... PC版: 手机版:

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人