英特尔Xe2 GPU正式发布:性能提升 50% 包含全新光线追踪内核

英特尔Xe2GPU正式发布:性能提升50%包含全新光线追踪内核英特尔Xe2正式发布,并将应用于LunarLakeCPU和代号为"Battlemage"的下一代Arc独立显卡阵容。英特尔Xe2的部分目标是提高利用率、改善工作分配和减少软件开销。Xe2是一项从头开始的设计,修复了Xe"Alchemist"GPU存在的几个主要问题。一开始,英特尔就用一张IP性能效率图向观众展示了高达12.5倍的显著收益,让人惊叹不已。我们将深入介绍Xe2是什么,以及英特尔是如何实现这些收益的。英特尔表示,Xe2架构与Xe架构一样,具有高度的可扩展性,这将促使其集成到LunarLake等低功耗移动SoC中,并集成到稍后推出的具有独立选项的高端Arc显卡中。第二代Xe内核或Xe2配备了多种计算资源,这些资源被重新划分为本地SIMD16引擎,以提高效率。Xe2核心功能8个512位矢量引擎8个2048位XMX引擎支持64b原子运算192KB共享L1$/SLM矢量引擎也已更新,其中包括:SIMD16本地ALU-支持SIMD16和SIMD32操作Xe矩阵扩展(支持INT2、INT4、INT8、FP16、BF16)扩展数学和FP64-常数:正弦、余弦、对数、指数3向共同发行-FP+INT/EM+XMXAlchemist"Xe"GPU上也有Xe矩阵引擎或XMX单元,但现在的变化是,它们支持更多数据类型,运行速度更快,FP16额定频率为2048OPS/时钟,INT8额定频率为4096OPS/时钟。让我们来看看这些新引擎是如何在Xe2渲染片段(Xe2GPU的基本模块)中堆叠的。这些渲染片可根据需要进行堆叠和扩展,并经过优化,以减少延迟、消除停滞并改善硬件/软件握手。这些渲染片连接到命令前端,该命令前端本机支持间接执行。渲染片还包括一个新的几何引擎,具有3倍的顶点获取吞吐量和3倍的网格着色性能(具有顶点重用功能);新的L1$/SLM缓存,用于顺序外采样(具有压缩纹理);2倍的无过滤采样吞吐量和可编程偏移;一个新的HiZ单元,缓存增加了50%,并支持对小型基元进行早期HiZ剔除。最后,还有两个新的像素后端(PixelBackends),可提供两倍的混合吞吐量,像素颜色缓存增加了33%,并可将目标预取渲染至L2$。Xe2的最新光线跟踪单元在Xe1的基础上进行了改进。Xe2内核的一个主要部分是RTU(光线跟踪单元),它具有3条遍历管道、18个方框交叉点(每个方框交叉点6个,每个RTU3个方框)和2个三角形交叉点。以上就是英特尔Xe2GPU架构的基本概述:第2代Xe2内核增强型矢量引擎深度缓存新型XMX发动机性能和效率-优化前端本机硬件支持exectue间接命令更大的光线跟踪装置总体而言,英特尔的Xe2GPU架构旨在与游戏更加兼容,并实现更高的利用率。新的执行间接块被游戏用来加速绘制调用,由于它被虚幻引擎等引擎大量使用,因此获得12.5倍的提升对游戏玩家来说是个好兆头。第一款采用Xe2GPU的产品是集成配置的LunarLake。LunarLake中的多个区块都与GPU有关,如媒体引擎和显示引擎。在谈这些之前,我们先来谈谈LunarLake的Xe2配置:8个Xe2内核64个矢量引擎2几何管道8个采样器4个像素后端8个光线追踪单元8MBL2$LunarLakeXe2GPU有8个Xe2内核,每个Xe2内核有8个XMX和8个矢量单元、一个负载/存储单元、一个线程排序单元和一个专用的L1/L$缓存。这4个Xe2内核中的每一个都能生成一个渲染片。那么,与MeteorLake的XeGPU相比,这一切的性能表现如何呢?英特尔表示,Xe2GPU在ISO下的性能提高了50%,在性能不变的情况下,功耗大幅降低。XMX块也是一个重要部分,它涌入了67个峰值INT8TOPS,为LunarLakeCPU的整体AI能力锦上添花。该芯片总共提供120个平台TOPS,其中48个TOPS来自NPU4,5个TOPS来自CPU本身。月球湖的Xe显示引擎现在,我们从GPU转向LunarLakeCPU本身的其他模块,首先是显示引擎。显示引擎配备3个显示管道,最高支持8K60HDR,最高支持3x4K60HDR,最高支持1080p360或1440p360。显示引擎支持HDMI2.1、DisplayPort2.1和新的eDP1.5功能。显示引擎的前端包括解码/解密和流缓冲区。在像素处理流水线方面,每个流水线有6个平面,支持色彩转换和合成的硬件,同时具有灵活性和高能效。此外,还有一个额外的低功耗优化流水线,带有面板重放功能(空闲帧期间的功率门控)和一个带有LACE(本地自适应对比度增强)功能的全新亮度传感器。在压缩和编码方面,显示流压缩引擎支持31种视觉无损压缩和传输编码(HDMI和DisplayPort协议的流编码)。路由器和端口包括流组装和端口路由,最多支持4个端口,增加了灵活性。回到带有面板重放功能的eDP(eDisplayPort)1.5,它被称为面板自刷新的进化版,具有早期传输和自适应同步支持的选择性更新。新的显示功能可减少抖动,改善播放效果,同时提供更高的能效。用于LunarLake的Xe媒体引擎--支持VVC、侧缓存和更好的编码LunarLakeSOC与Xe2GPU连接的最后一个区块是媒体引擎,它现在拥有自己专用的8MB共享侧缓存。芯片的其他部分可以使用这个新缓存,但没有必要,因为其他内核本身就有专用缓存。这种侧缓存可为LunarLake节省大量带宽,因为跨媒体工作负载的系统内存流量减少了。这也大大降低了编码工作负载的功耗。媒体引擎支持最高达8k6010位HDR解码、高达8k6010位HDR编码、AVC、VP9、H.265HEVC、AV1和全新的VVC引擎。VVC引擎大大降低了比特率,同时提供与AV1相同的质量(文件大小最多减少10%)。它还支持自适应分辨率流和屏幕内容编码。最后,我们的WindowsGPU软件栈已经为Xe2GPU做好了准备。英特尔表示,它花了大量时间调整Alchemist"Xe"GPU的API级性能,尤其是DX9,但所有这些软件工作都将转移到Xe2,并支持所有最新的API和框架及其运行时。Xe2是一种全新的图形架构,它为LunarLake等集成解决方案和即将推出的ArcBattlemage系列的独立选项带来了巨大的性能提升和最新的功能集。公司将在今年晚些时候分享更多有关Battlemage独立产品的信息。...PC版:https://www.cnbeta.com.tw/articles/soft/1433526.htm手机版:https://m.cnbeta.com.tw/view/1433526.htm

相关推荐

封面图片

就像AV1一样 英特尔率先支持H.266 (VVC) 解码

就像AV1一样英特尔率先支持H.266(VVC)解码Xe2在英特尔新的LunarLake移动处理器中首次亮相,而Xe2的媒体引擎带来的VVC支持令人印象深刻。VVC或VersatileVideoCodec是HEVC或高效视频编解码器的后续版本。因此,就像HEVC被称为H.265一样,它的正式名称也被称为H.266,并且早在2020年就已公布。与H.265编解码器一样,H.266也承诺以更小的尺寸带来更好的质量,最高可达50%。遗憾的是,与H.264和265不同,H.266没有得到市场的采用,AV1成为了更受欢迎的选择。希望随着英特尔增加对该编解码器的支持,AMD和NVIDIA最终也会这样做。据英特尔公司称,H.266比AV1的文件大小减少了10%。谈到GPU设计本身,英特尔表示,Xe2比MeteorLake内的Xe图形处理器快1.5倍或50%。这一提升得益于其架构上的改进。英特尔称,Xe2在最差情况下的改进是镶嵌技术的20%,而在最佳情况下,改进高达12.5倍。英特尔在下面的幻灯片中重点介绍了这些改进:令人感兴趣的是,Xe2将如何与AMD的新RDNA3.5集成图形处理器(iGP)相抗衡,后者昨天与新RyzenAI300系列部件一起发布。与英特尔Xe2的67TOPS不同,AMD似乎没有具体说明RDNA3.5iGP的AI性能。...PC版:https://www.cnbeta.com.tw/articles/soft/1433520.htm手机版:https://m.cnbeta.com.tw/view/1433520.htm

封面图片

英特尔Xe Linux内核图形驱动程序将取代"i915"以用于未来的GPU

英特尔XeLinux内核图形驱动程序将取代"i915"以用于未来的GPUi915图形驱动最初是在915G北桥芯片组推出期间生成的。现在,开发人员正在研究用基于Xe的内核图形驱动程序来更新i915图形内核,这将有助于支持集成和独立的英特尔显卡,预计最快将于明年推出。这个新的DRM(直接渲染管理器)驱动程序将开始支持Xe图形和第12代图形芯片,新管理器到位后将继续向后支持i915驱动程序。而官方希望最新的图形驱动程序能够为当前一代图形和不久的将来提供更多的效率和精简,而不需要再更换若干代。开发人员正在关注基于Xe的新驱动,用于TigerLake和更高版本的iGPU以及已经上市的dGPU。新驱动程序将允许改进对TTM内存、AMDGPU的DRM调度器和其他小领域的管理。此外,新驱动程序将与英特尔的IrisGallium3D和ANVVulkan驱动程序协同工作,未来还可能支持Mesa3D。新的OpenCL的NEO计算堆栈和oneAPILevelZero将和其他提到的一起被支持。英特尔今天发布了一个RFC补丁系列,"功能足以运行GNOME、浏览器、OpenGL游戏、Vulkan游戏[...]"。不过据报道,这个新的MR也有问题正在被调查中,所以我们应该很快就能看到修复。MichaelLarabel提到,新的围绕英特尔Xe开发的图形驱动将有利于当前和即将到来的公司的处理器,因为对代码的优化已经包括了几个英特尔CPU架构,包括Arm和x86_64芯片组,允许架构之间更好的沟通。有可能再过几代之后,一旦更多世代的图形卡采用新的Xe图形驱动,i915驱动就会退出使用。...PC版:https://www.cnbeta.com.tw/articles/soft/1336227.htm手机版:https://m.cnbeta.com.tw/view/1336227.htm

封面图片

英特尔 Xe2 Linux 开源驱动带来原生 64 位整数运算能力

英特尔Xe2Linux开源驱动带来原生64位整数运算能力在英特尔的Mesa驱动程序代码中,"has_64bit_int"属性被设置为true...除了旧的Gen8Broadwell显卡,Xe或之前的英特尔显卡都没有这种功能。从那时起到现在,英特尔显卡都不支持原生64位整数,而是在这种情况下依靠模拟来实现64位整数。特别是对于工作站GPU的需求而言,这种原生64位int数学支持似乎是所有英特尔Xe2显卡的美好前景。作为合并请求的一部分,该补丁已被合并到Mesa24.2-devel中,以调整iadd3与int64、小型iadd3选项和int64选项。鉴于LunarLake移动处理器将于第三季度发布,英特尔Battlemage显卡也可能在年底前推出,希望8月份发布的Mesa24.2能很好地支持Xe2,这将有助于在Ubuntu24.10中找到所需的位。...PC版:https://www.cnbeta.com.tw/articles/soft/1433188.htm手机版:https://m.cnbeta.com.tw/view/1433188.htm

封面图片

配备英特尔Xe驱动、支持树莓派GPU等新硬件的Linux 6.8将于明日发布

配备英特尔Xe驱动、支持树莓派GPU等新硬件的Linux6.8将于明日发布Linux6.8为即将到来的AMDZen5硬件添加了更多新特性,启用了更多英特尔LunarLake功能,AMD色彩管理代码的早期工作已被上传到上游,但未在默认情况下构建,英特尔XeDRM驱动程序已被上传到上游,以试验性地支持当前的英特尔显卡,ImaginationPowerVRRogueDRM驱动程序已被上传到上游,初步支持RaspberryPi5显卡驱动程序,支持多款基于ARM的廉价掌上游戏机,支持任天堂SwitchOnline控制器,继续调整Linux内核调度程序,以及提升网络TCP性能以支持多并发连接。以上是我们Linux6.8中最令人兴奋的元素的快速总结。即将发布的Ubuntu24.04LTS、Fedora40和其他春季Linux发行版都将使用Linux6.8作为基础。希望明天(3月10日)发布的Linux6.8能保持良好的状态,然后顺利启动Linux6.9周期。...PC版:https://www.cnbeta.com.tw/articles/soft/1423067.htm手机版:https://m.cnbeta.com.tw/view/1423067.htm

封面图片

英特尔Arc A580 GPU显卡规格公布 售价179.99美元起

英特尔ArcA580GPU显卡规格公布售价179.99美元起Xe核-24个渲染切片-6个光线追踪单元-24个英特尔Xe矩阵扩展(英特尔XMX)引擎-384个Xe矢量引擎-384个图形时钟-1700MHzTBP-185WPCIExpress配置-最高支持PCIExpress4.0x16设备ID0-x56A2内存大小-8GB内存类型-GDDR6显存接口-256位显存带宽-512GB/s显存速度-16Gbps英特尔还发布了一张图表,显示了新的ArcA580GPU可以达到的每秒帧数。它声称可以以最高155fps的帧数运行暴雪的《暗黑破坏神IV》、以最高119fps的帧数运行《博德之门3》和《赛博朋克2077》等游戏,在开启XeSS和RayTracing的情况下,帧数可以达到85fpg。英特尔没有销售公版的ArcA580显卡,至少目前没有。不过,第三方正在销售配备该GPU的显卡。你现在可以在新蛋上找到其中两款。一款是售价179.9美元的SparkleIntelArcA580ORCOC版。另一款是华擎挑战者ArcA580,售价稍高,为184.99美元。英特尔表示,GUNNIR也将销售ArcA580显卡。...PC版:https://www.cnbeta.com.tw/articles/soft/1389135.htm手机版:https://m.cnbeta.com.tw/view/1389135.htm

封面图片

英特尔发布全新Lunar Lake处理器

英特尔发布全新LunarLake处理器该处理器和苹果M系芯片内存封装相似,无法后期更换,支持最高32GB 总内存容量的LPDDR5X。LunarLake 的整体采用Tile模块化设计,2颗Tile为台积电N3B工艺。拥有完整的CPU、GPU、媒体引擎、显示引擎、图像引擎和NPU。其余还有负责SoC 对外连接的平台控制模块,三大模块使用Foveros 技术,以3D 的形式封装在基础模块上,共同构成了LunarLake 整个SoC。 CPU采用P+E混合架构,P核心使用LionCove微架构,E核心使用Skymont微架构,搭载Xe2代核显,整体功耗和图形性能显著提升。LionCove针对单线程优化,提升能效和面积效率。Skymont微架构提高内核并行处理能力,优化功耗。关注频道@ZaiHuaPd频道爆料@ZaiHuabot

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人