AdobePremierePro22.2发布，英伟达/英特尔GPU编码速度大幅提升-IT之家https://www.ithome.com/0/602/261.htm

英特尔FalconShoresGPU明年晚些时候推出，已为AI负载重构-IT之家https://www.ithome.com/0

【英特尔GPU取经路能否“通关”？】英特尔“老将”RohitVerma将从AMD回到英特尔，担任英特尔GPU部门首席产品架构师。

效仿英伟达？英特尔或将推出中国定制版数据中心 GPU

效仿英伟达？英特尔或将推出中国定制版数据中心GPU英特尔近日向国外科技媒体Tom'sHardware证实，已重新调整了DataCenterGPUMax系列。将在2023年晚些时候，推出降低I/O带宽的Max1450，以满足“不同市场”的需求。虽然英特尔并未明言那个“不同市场”，但外界普遍认为与美对华GPU出口管制有关。最初的PonteVecchioGPU阵容包括DataCenterMaxGPU1550、1350和1100。Max1550原本是针对液冷设计的，但已经成功进行风冷部署，所以现在取消了Max1350系列。似乎也是为了给MAX1450让路。http://www.icsmart.cn/61340/https://www.tomshardware.com/news/intel-axes-data-center-gpu-max-1350-preps-max-1450-for-different-markets

绿联与英特尔在NAS领域达成深度合作，打造性能更强私有云存储-IT之家https://www.ithome.com/0/709/

英特尔遭集体诉讼：涉嫌隐瞒晶圆代工部门巨额亏损-IT之家https://www.ithome.com/0/775/526.htm

英特尔Xe2 GPU正式发布：性能提升 50% 包含全新光线追踪内核

英特尔Xe2GPU正式发布：性能提升50%包含全新光线追踪内核英特尔Xe2正式发布，并将应用于LunarLakeCPU和代号为"Battlemage"的下一代Arc独立显卡阵容。英特尔Xe2的部分目标是提高利用率、改善工作分配和减少软件开销。Xe2是一项从头开始的设计，修复了Xe"Alchemist"GPU存在的几个主要问题。一开始，英特尔就用一张IP性能效率图向观众展示了高达12.5倍的显著收益，让人惊叹不已。我们将深入介绍Xe2是什么，以及英特尔是如何实现这些收益的。英特尔表示，Xe2架构与Xe架构一样，具有高度的可扩展性，这将促使其集成到LunarLake等低功耗移动SoC中，并集成到稍后推出的具有独立选项的高端Arc显卡中。第二代Xe内核或Xe2配备了多种计算资源，这些资源被重新划分为本地SIMD16引擎，以提高效率。Xe2核心功能8个512位矢量引擎8个2048位XMX引擎支持64b原子运算192KB共享L1$/SLM矢量引擎也已更新，其中包括：SIMD16本地ALU-支持SIMD16和SIMD32操作Xe矩阵扩展（支持INT2、INT4、INT8、FP16、BF16）扩展数学和FP64-常数：正弦、余弦、对数、指数3向共同发行-FP+INT/EM+XMXAlchemist"Xe"GPU上也有Xe矩阵引擎或XMX单元，但现在的变化是，它们支持更多数据类型，运行速度更快，FP16额定频率为2048OPS/时钟，INT8额定频率为4096OPS/时钟。让我们来看看这些新引擎是如何在Xe2渲染片段（Xe2GPU的基本模块）中堆叠的。这些渲染片可根据需要进行堆叠和扩展，并经过优化，以减少延迟、消除停滞并改善硬件/软件握手。这些渲染片连接到命令前端，该命令前端本机支持间接执行。渲染片还包括一个新的几何引擎，具有3倍的顶点获取吞吐量和3倍的网格着色性能（具有顶点重用功能）；新的L1$/SLM缓存，用于顺序外采样（具有压缩纹理）；2倍的无过滤采样吞吐量和可编程偏移；一个新的HiZ单元，缓存增加了50%，并支持对小型基元进行早期HiZ剔除。最后，还有两个新的像素后端（PixelBackends），可提供两倍的混合吞吐量，像素颜色缓存增加了33%，并可将目标预取渲染至L2$。Xe2的最新光线跟踪单元在Xe1的基础上进行了改进。Xe2内核的一个主要部分是RTU（光线跟踪单元），它具有3条遍历管道、18个方框交叉点（每个方框交叉点6个，每个RTU3个方框）和2个三角形交叉点。以上就是英特尔Xe2GPU架构的基本概述：第2代Xe2内核增强型矢量引擎深度缓存新型XMX发动机性能和效率-优化前端本机硬件支持exectue间接命令更大的光线跟踪装置总体而言，英特尔的Xe2GPU架构旨在与游戏更加兼容，并实现更高的利用率。新的执行间接块被游戏用来加速绘制调用，由于它被虚幻引擎等引擎大量使用，因此获得12.5倍的提升对游戏玩家来说是个好兆头。第一款采用Xe2GPU的产品是集成配置的LunarLake。LunarLake中的多个区块都与GPU有关，如媒体引擎和显示引擎。在谈这些之前，我们先来谈谈LunarLake的Xe2配置：8个Xe2内核64个矢量引擎2几何管道8个采样器4个像素后端8个光线追踪单元8MBL2$LunarLakeXe2GPU有8个Xe2内核，每个Xe2内核有8个XMX和8个矢量单元、一个负载/存储单元、一个线程排序单元和一个专用的L1/L$缓存。这4个Xe2内核中的每一个都能生成一个渲染片。那么，与MeteorLake的XeGPU相比，这一切的性能表现如何呢？英特尔表示，Xe2GPU在ISO下的性能提高了50%，在性能不变的情况下，功耗大幅降低。XMX块也是一个重要部分，它涌入了67个峰值INT8TOPS，为LunarLakeCPU的整体AI能力锦上添花。该芯片总共提供120个平台TOPS，其中48个TOPS来自NPU4，5个TOPS来自CPU本身。月球湖的Xe显示引擎现在，我们从GPU转向LunarLakeCPU本身的其他模块，首先是显示引擎。显示引擎配备3个显示管道，最高支持8K60HDR，最高支持3x4K60HDR，最高支持1080p360或1440p360。显示引擎支持HDMI2.1、DisplayPort2.1和新的eDP1.5功能。显示引擎的前端包括解码/解密和流缓冲区。在像素处理流水线方面，每个流水线有6个平面，支持色彩转换和合成的硬件，同时具有灵活性和高能效。此外，还有一个额外的低功耗优化流水线，带有面板重放功能（空闲帧期间的功率门控）和一个带有LACE（本地自适应对比度增强）功能的全新亮度传感器。在压缩和编码方面，显示流压缩引擎支持31种视觉无损压缩和传输编码（HDMI和DisplayPort协议的流编码）。路由器和端口包括流组装和端口路由，最多支持4个端口，增加了灵活性。回到带有面板重放功能的eDP（eDisplayPort）1.5，它被称为面板自刷新的进化版，具有早期传输和自适应同步支持的选择性更新。新的显示功能可减少抖动，改善播放效果，同时提供更高的能效。用于LunarLake的Xe媒体引擎--支持VVC、侧缓存和更好的编码LunarLakeSOC与Xe2GPU连接的最后一个区块是媒体引擎，它现在拥有自己专用的8MB共享侧缓存。芯片的其他部分可以使用这个新缓存，但没有必要，因为其他内核本身就有专用缓存。这种侧缓存可为LunarLake节省大量带宽，因为跨媒体工作负载的系统内存流量减少了。这也大大降低了编码工作负载的功耗。媒体引擎支持最高达8k6010位HDR解码、高达8k6010位HDR编码、AVC、VP9、H.265HEVC、AV1和全新的VVC引擎。VVC引擎大大降低了比特率，同时提供与AV1相同的质量（文件大小最多减少10%）。它还支持自适应分辨率流和屏幕内容编码。最后，我们的WindowsGPU软件栈已经为Xe2GPU做好了准备。英特尔表示，它花了大量时间调整Alchemist"Xe"GPU的API级性能，尤其是DX9，但所有这些软件工作都将转移到Xe2，并支持所有最新的API和框架及其运行时。Xe2是一种全新的图形架构，它为LunarLake等集成解决方案和即将推出的ArcBattlemage系列的独立选项带来了巨大的性能提升和最新的功能集。公司将在今年晚些时候分享更多有关Battlemage独立产品的信息。...PC版：https://www.cnbeta.com.tw/articles/soft/1433526.htm手机版：https://m.cnbeta.com.tw/view/1433526.htm

相关推荐

英特尔FalconShoresGPU明年晚些时候推出，已为AI负载重构-IT之家https://www.ithome.com/0

【英特尔GPU取经路能否“通关”？】英特尔“老将”RohitVerma将从AMD回到英特尔，担任英特尔GPU部门首席产品架构师。

效仿英伟达？英特尔或将推出中国定制版数据中心 GPU

绿联与英特尔在NAS领域达成深度合作，打造性能更强私有云存储-IT之家https://www.ithome.com/0/709/

英特尔遭集体诉讼：涉嫌隐瞒晶圆代工部门巨额亏损-IT之家https://www.ithome.com/0/775/526.htm

英特尔Xe2 GPU正式发布：性能提升 50% 包含全新光线追踪内核