英特尔Xe2 GPU正式发布:性能提升 50% 包含全新光线追踪内核

英特尔Xe2 GPU正式发布:性能提升 50% 包含全新光线追踪内核 英特尔 Xe2 正式发布,并将应用于 Lunar Lake CPU 和代号为"Battlemage"的下一代 Arc 独立显卡阵容。英特尔 Xe2 的部分目标是提高利用率、改善工作分配和减少软件开销。Xe2 是一项从头开始的设计,修复了 Xe"Alchemist"GPU 存在的几个主要问题。一开始,英特尔就用一张 IP 性能效率图向观众展示了高达 12.5 倍的显著收益,让人惊叹不已。我们将深入介绍 Xe2 是什么,以及英特尔是如何实现这些收益的。英特尔表示,Xe2 架构与 Xe 架构一样,具有高度的可扩展性,这将促使其集成到 Lunar Lake 等低功耗移动 SoC 中,并集成到稍后推出的具有独立选项的高端 Arc 显卡中。第二代 Xe 内核或 Xe2 配备了多种计算资源,这些资源被重新划分为本地 SIMD16 引擎,以提高效率。Xe2 核心功能8 个 512 位矢量引擎8 个 2048 位 XMX 引擎支持 64b 原子运算192KB 共享 L1$/SLM矢量引擎也已更新,其中包括:SIMD16 本地 ALU -支持 SIMD16 和 SIMD32 操作Xe 矩阵扩展(支持 INT2、INT4、INT8、FP16、BF16)扩展数学和 FP64 -常数:正弦、余弦、对数、指数3 向共同发行 -FP + INT/EM + XMXAlchemist"Xe"GPU 上也有 Xe 矩阵引擎或 XMX 单元,但现在的变化是,它们支持更多数据类型,运行速度更快,FP16 额定频率为 2048 OPS/时钟,INT8 额定频率为 4096 OPS/时钟。让我们来看看这些新引擎是如何在 Xe2 渲染片段(Xe2 GPU 的基本模块)中堆叠的。这些渲染片可根据需要进行堆叠和扩展,并经过优化,以减少延迟、消除停滞并改善硬件/软件握手。这些渲染片连接到命令前端,该命令前端本机支持间接执行。渲染片还包括一个新的几何引擎,具有 3 倍的顶点获取吞吐量和 3 倍的网格着色性能(具有顶点重用功能);新的 L1$/SLM 缓存,用于顺序外采样(具有压缩纹理);2 倍的无过滤采样吞吐量和可编程偏移;一个新的 HiZ 单元,缓存增加了 50%,并支持对小型基元进行早期 HiZ 剔除。最后,还有两个新的像素后端(Pixel Backends),可提供两倍的混合吞吐量,像素颜色缓存增加了 33%,并可将目标预取渲染至 L2$。Xe2 的最新光线跟踪单元在 Xe1 的基础上进行了改进。Xe2 内核的一个主要部分是 RTU(光线跟踪单元),它具有 3 条遍历管道、18 个方框交叉点(每个方框交叉点 6 个,每个 RTU 3 个方框)和 2 个三角形交叉点。以上就是英特尔 Xe2 GPU 架构的基本概述:第 2 代 Xe2 内核增强型矢量引擎深度缓存新型 XMX 发动机性能和效率 - 优化前端本机硬件支持 exectue 间接命令更大的光线跟踪装置总体而言,英特尔的 Xe2 GPU 架构旨在与游戏更加兼容,并实现更高的利用率。新的执行间接块被游戏用来加速绘制调用,由于它被虚幻引擎等引擎大量使用,因此获得 12.5 倍的提升对游戏玩家来说是个好兆头。第一款采用 Xe2 GPU 的产品是集成配置的 Lunar Lake。Lunar Lake 中的多个区块都与 GPU 有关,如媒体引擎和显示引擎。在谈这些之前,我们先来谈谈 Lunar Lake 的 Xe2 配置:8 个 Xe2 内核64 个矢量引擎2 几何管道8 个采样器4 个像素后端8 个光线追踪单元8 MB L2$Lunar Lake Xe2 GPU 有 8 个 Xe2 内核,每个 Xe2 内核有 8 个 XMX 和 8 个矢量单元、一个负载/存储单元、一个线程排序单元和一个专用的 L1/L$ 缓存。这 4 个 Xe2 内核中的每一个都能生成一个渲染片。那么,与 Meteor Lake 的 Xe GPU 相比,这一切的性能表现如何呢?英特尔表示,Xe2 GPU 在 ISO 下的性能提高了 50%,在性能不变的情况下,功耗大幅降低。XMX 块也是一个重要部分,它涌入了 67 个峰值 INT8 TOPS,为 Lunar Lake CPU 的整体 AI 能力锦上添花。该芯片总共提供 120 个平台 TOPS,其中 48 个 TOPS 来自 NPU4,5 个 TOPS 来自 CPU 本身。月球湖的 Xe 显示引擎现在,我们从 GPU 转向 Lunar Lake CPU 本身的其他模块,首先是显示引擎。显示引擎配备 3 个显示管道,最高支持 8K60 HDR,最高支持 3x 4K60 HDR,最高支持 1080p360 或 1440p360。显示引擎支持 HDMI 2.1、DisplayPort 2.1 和新的 eDP 1.5 功能。显示引擎的前端包括解码/解密和流缓冲区。在像素处理流水线方面,每个流水线有 6 个平面,支持色彩转换和合成的硬件,同时具有灵活性和高能效。此外,还有一个额外的低功耗优化流水线,带有面板重放功能(空闲帧期间的功率门控)和一个带有 LACE(本地自适应对比度增强)功能的全新亮度传感器。在压缩和编码方面,显示流压缩引擎支持 31 种视觉无损压缩和传输编码(HDMI 和 DisplayPort 协议的流编码)。路由器和端口包括流组装和端口路由,最多支持 4 个端口,增加了灵活性。回到带有面板重放功能的 eDP(eDisplayPort)1.5,它被称为面板自刷新的进化版,具有早期传输和自适应同步支持的选择性更新。新的显示功能可减少抖动,改善播放效果,同时提供更高的能效。用于 Lunar Lake 的 Xe 媒体引擎支持 VVC、侧缓存和更好的编码Lunar Lake SOC 与 Xe2 GPU 连接的最后一个区块是媒体引擎,它现在拥有自己专用的 8 MB 共享侧缓存。芯片的其他部分可以使用这个新缓存,但没有必要,因为其他内核本身就有专用缓存。这种侧缓存可为 Lunar Lake 节省大量带宽,因为跨媒体工作负载的系统内存流量减少了。这也大大降低了编码工作负载的功耗。媒体引擎支持最高达 8k60 10 位 HDR 解码、高达 8k60 10 位 HDR 编码、AVC、VP9、H.265 HEVC、AV1 和全新的 VVC 引擎。VVC 引擎大大降低了比特率,同时提供与 AV1 相同的质量(文件大小最多减少 10%)。它还支持自适应分辨率流和屏幕内容编码。最后,我们的 Windows GPU 软件栈已经为 Xe2 GPU 做好了准备。英特尔表示,它花了大量时间调整 Alchemist"Xe"GPU 的 API 级性能,尤其是 DX9,但所有这些软件工作都将转移到 Xe2,并支持所有最新的 API 和框架及其运行时。Xe2 是一种全新的图形架构,它为 Lunar Lake 等集成解决方案和即将推出的 Arc Battlemage 系列的独立选项带来了巨大的性能提升和最新的功能集。公司将在今年晚些时候分享更多有关 Battlemage 独立产品的信息。 ... PC版: 手机版:

相关推荐

封面图片

英特尔Arc Xe2 "Battlemage"独立GPU采用台积电4纳米工艺制造

英特尔Arc Xe2 "Battlemage"独立GPU采用台积电4纳米工艺制造 与 N6 相比,台积电 N4 节点在晶体管密度、性能和能效方面都有显著提高,这使得英特尔最大的 "Battlemage "变体的 Xe 内核数量几乎翻了一番。再加上更高的 IPC、时钟速度和其他特性,"Battlemage "预计能与当今的 AMD RDNA 3 和NVIDIA Ada 游戏 GPU 相抗衡。有趣的是,台积电 N4 并不是 Xe2 "Battlemage "最先进的代工节点。英特尔酷睿200V "Lunar Lake"处理器的iGPU是其计算芯片的一部分,英特尔正在更先进的台积电N3(3纳米)节点上构建该芯片。 ... PC版: 手机版:

封面图片

英特尔Battlemage Xe2 GPU据报被搁置 Celestial Xe3可能也会推迟发布

英特尔Battlemage Xe2 GPU据报被搁置 Celestial Xe3可能也会推迟发布 英特尔Arc Battlemage"Xe2"图形处理器将成为下一代Lunar Lake"酷睿Ultra 200V"CPU的重要组成部分,预计将于今年晚些时候亮相,并计划于2024年上半年开始推广。我们已经看到了这些芯片的泄露信息,其性能比 Alchemist 和 Alchemist+ 芯片快得多,这表明使用了升级的图形架构。这仍然是该架构的 Xe2-LPG 或移动版本,而被称为 Xe2-HPG 的高端独立 GPU 变体据说将推迟推出。第二个被提及的芯片是 DG3 或 Xe3,这是英特尔 Arc Celestial 图形架构的代号。该架构预计将作为 Xe3-LPG iGPU 在英特尔的 Panther Lake CPU 系列中首次亮相,但看起来这篇帖子暗示明年不会有 Xe3。英特尔已经证实,Panther Lake 将于 2025 年下半年推出,并将使用英特尔的 18A、英特尔 3 和外部(台积电)工艺节点。现在还不清楚这一传言是暗示独立图形处理器系列、集成图形处理器系列,还是两者都会推迟。独立图形处理器的开发很可能会后退一步,因为该公司正把更多的精力放在集成图形处理器上。已经有报道称,英特尔的Arc Battlemage"Xe2" Arc显卡预计将于2024年底亮相,而且该GPU已经出现在多个补丁中,表明目前工作正在进行中。因此,如果英特尔突然决定推迟甚至取消这些芯片,将令许多用户和技术社区大失所望,英特尔此前通过持续的驱动程序更新(包括优化、修复和对许多新游戏的第 0/1 天支持)在微调其 Arc 产品性能方面做得非常好。 ... PC版: 手机版:

封面图片

英特尔Arc Battlemage"Xe2 "GPU预计将于2024年底推出

英特尔Arc Battlemage"Xe2 "GPU预计将于2024年底推出 2024 年的"黑色星期五"促销将于 11 月 29 日开启,因此我们可以预计,英特尔将在 11 月发布某种消息或揭幕仪式,然后在未来几个月内推出零售产品。如果消息属实,那么英特尔 Arc B 系列 Battlemage"Xe2"图形处理器的发布将比10 月底发布的 Arc A770晚近两年,因此 11 月发布似乎并无不妥。至于我们所知道的英特尔Arc Battlemage"Xe2"独立图形处理器,目前已经确认的有两个SKU,包括BMG-10和BMG-21。前者是高端 SKU,后者是中端 SKU。这两款芯片都将定位在代表独立 GPU 系列的 Xe2-HPG 阵容中,但还有一个Lunar Lake 阵容,该阵容将承载采用相同 Battlemage 图形架构的 Xe2-LPG iGPU。这些芯片预计也将在今年晚些时候亮相。早些时候,我们还报道了一些关于 Battlemage"Xe2"游戏图形处理器的传言,其中包括一些功能:新一代内存子系统与压缩改进光线追踪微架构改进基于 ML 的新一代渲染技术最新的 DeepLink 功能以高性能/发烧级游戏为目标我们可能会看到与 Battlemage Xe2 游戏 GPU 一起亮相的另一项功能是英特尔自己的XeSS 帧生成技术,预计它将利用帧外推(Frame Extrapolation)技术,这与英伟达(NVIDIA)的 DLSS 和 AMD 的 FSR 算法所使用的插帧(Frame Interpolation)技术完全相反。英特尔的汤姆-彼得森(Tom Petersen)不久前已经预告了 Battlemage 的新技术和架构修复。最近,英特尔 Battlemage Xe2 GPU 开始出现在基准数据库中,而且 ES 变体也出现在出货清单中,因此英特尔很有可能正在为 2024 年下半年的发布做准备。我们甚至有可能在几周后的2024 年国际电脑展上首次看到 Battlemage 的预告。 ... PC版: 手机版:

封面图片

英特尔 Xe2 Linux 开源驱动带来原生 64 位整数运算能力

英特尔 Xe2 Linux 开源驱动带来原生 64 位整数运算能力 在英特尔的 Mesa 驱动程序代码中,"has_64bit_int"属性被设置为 true...除了旧的 Gen8 Broadwell 显卡,Xe 或之前的英特尔显卡都没有这种功能。从那时起到现在,英特尔显卡都不支持原生 64 位整数,而是在这种情况下依靠模拟来实现 64 位整数。特别是对于工作站 GPU 的需求而言,这种原生 64 位 int 数学支持似乎是所有英特尔 Xe2 显卡的美好前景。作为合并请求的一部分,该补丁已被合并到 Mesa 24.2-devel 中,以调整 iadd3 与 int64、小型 iadd3 选项和 int64 选项。鉴于 Lunar Lake 移动处理器将于第三季度发布,英特尔 Battlemage 显卡也可能在年底前推出,希望 8 月份发布的 Mesa 24.2 能很好地支持 Xe2,这将有助于在 Ubuntu 24.10 中找到所需的位。 ... PC版: 手机版:

封面图片

英特尔Moon Lake 8核CPU早期样品曝光:2.8GHz、12 MB L3缓存、"Xe2" iGPU

英特尔Moon Lake 8核CPU早期样品曝光:2.8GHz、12 MB L3缓存、"Xe2" iGPU 该样本非常有趣,因为它运行在三星下一代 Galaxy Book5 Pro 笔记本电脑上,具体 SKU 编号为"NT940XGK-DSD"。它是三星现有 Galaxy Book4 系列的后续产品,配置了英特尔流星湖"酷睿 Ultra"芯片。让我们从规格开始,英特尔月亮湖 CPU 被列为"Genuine Intel(R) 0000 1.60GHz",它共有 8 个内核,由四个 Lion Cove P-Cores 和四个 Skymont E-Cores 组成。由于下一代产品预计将取消 SMT,因此我们可能只看到 8 个线程。基本时钟频率设定为 1.6 GHz,而提升时钟频率则为2.8 GHz,看得出来这对于这款特定芯片来说仍是非常早期的时钟频率。此外,该芯片还配备了 12 MB 三级缓存和 10 MB 二级缓存。英特尔的 8 核 Lunar Lake CPU 此前也曾在 Windows PC 上运行过。至于图形方面,英特尔的 Lunar Lake CPU 将采用下一代 Battlemage Xe2-LPG 图形架构。iGPU 将以 Arc 系列为品牌,配备 4 个 Xe 核或 64 个矢量引擎,共 512 个 ALU。芯片主频为 1.85 GHz,拥有 8 MB 二级缓存。GPU 的性能与我们之前看到的 Xe2-LPG iGPU 相一致。以下是 Lunar Lake CPU 的部分特性:专为轻薄笔记本电脑设计Lion Cove P-Core 和 Skymont E-CoreBattlemage"Xe2-LPG"图形处理器架构4+4 内核配置(MX 系列)最多 64 个执行单元封装内 LPDDR5x 内存NPU 性能比 Meteor Lake 快达 3 倍2024 年末发射,2025 年量产早期的性能数据显示,英特尔 Lunar Lake CPU 将以更低的 TDP 提供比 Meteor Lake CPU 更高的性能。再加上几乎快 2 倍的 iGPU,这对该芯片主要针对的笔记本电脑市场来说将是一个很好的证明。英特尔 Lunar Lake CPU 预计将于今年晚些时候限量发售,到 2025 年初将有更多产品上市。 ... PC版: 手机版:

封面图片

英特尔 Battlemage BMG-G31 GPU 现已曝光

英特尔 Battlemage BMG-G31 GPU 现已曝光 据说这些 Arc GPU 将在未来几个月内推出,但到目前为止英特尔一直守口如瓶,因为他们目前正专注于 Lunar Lake 的 Xe2 集成产品。英特尔的 Design-iN Tools Store 似乎已经透露,Arc Battlemage BMG-G31 GPU 确实是真的,而且已经对这款即将推出的芯片进行了测试。该商店列出了"PTT Engagement - BGA3283-BMG-G31 VRTT Interposer - Prototypes"(PTT参与BGA3283-BMG-G31 VRTT Interposer原型),显示该特定 SKU 采用 BGA 3283 球脚,这一信息对玩家来说可能并不重要,但它确实表明该芯片的尺寸比之前出现在同一网站上的其他 Battlemage 芯片要大。ACM-G10:BGA 2660BMG-G21: BGA 2362BMG-G10:BGA 2727BMG-G31: BGA 3283根据@SquashBionic 分享的信息,Intel Arc Battlemage BMG-G31 GPU 据称将拥有 32 个 Xe2 核心,并将保留 GDDR6 接口,因此总共将拥有 4096 个 ALU,这与 Arc A770 显卡上现有的旗舰产品、基于 Alchemist 的 ACM-G10 非常相似。不过,随着性能的提升,如果有适当的软件支持和物美价廉的产品支持,我们还是可以期待一款出色的主流产品。另外还提到,Battlemage 独立显卡将采用原生 Gen5 设计,但也将向后兼容以前的 PCIe 标准。几个月前,RedGamingTech首次披露了有关 Battlemage GPU SKU 和 BMG-G31 芯片的信息。根据详细信息,G31 芯片拥有 32 个 Xe2 内核和 256 位接口,而Battlemage BMG-G21 芯片据说将拥有 20 个 Xe 内核和 192 位总线接口。英特尔的下一代 Battlemage GPU 有可能在今年的创新大会上正式发布,发布时间可能在 2024 年底或 2025 年初。与此同时,英特尔的 Xe2 图形架构将在 Lunar Lake CPU 中首次亮相,其下一代 Arc iGPU 设计有望在早期的合成基准测试中提供令人印象深刻的性能提升。 ... PC版: 手机版:

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人