AdobePremierePro22.2发布,英伟达/英特尔GPU编码速度大幅提升-IT之家https://www.ithome.com/0/602/261.htm

None

相关推荐

封面图片

英特尔FalconShoresGPU明年晚些时候推出,已为AI负载重构-IT之家https://www.ithome.com/0

封面图片

【英特尔GPU取经路能否“通关”?】英特尔“老将”RohitVerma将从AMD回到英特尔,担任英特尔GPU部门首席产品架构师。

封面图片

效仿英伟达?英特尔或将推出中国定制版数据中心 GPU

效仿英伟达?英特尔或将推出中国定制版数据中心GPU英特尔近日向国外科技媒体Tom'sHardware证实,已重新调整了DataCenterGPUMax系列。将在2023年晚些时候,推出降低I/O带宽的Max1450,以满足“不同市场”的需求。虽然英特尔并未明言那个“不同市场”,但外界普遍认为与美对华GPU出口管制有关。最初的PonteVecchioGPU阵容包括DataCenterMaxGPU1550、1350和1100。Max1550原本是针对液冷设计的,但已经成功进行风冷部署,所以现在取消了Max1350系列。似乎也是为了给MAX1450让路。http://www.icsmart.cn/61340/https://www.tomshardware.com/news/intel-axes-data-center-gpu-max-1350-preps-max-1450-for-different-markets

封面图片

绿联与英特尔在NAS领域达成深度合作,打造性能更强私有云存储-IT之家https://www.ithome.com/0/709/

封面图片

英特尔遭集体诉讼:涉嫌隐瞒晶圆代工部门巨额亏损-IT之家https://www.ithome.com/0/775/526.htm

封面图片

英特尔Xe2 GPU正式发布:性能提升 50% 包含全新光线追踪内核

英特尔Xe2GPU正式发布:性能提升50%包含全新光线追踪内核英特尔Xe2正式发布,并将应用于LunarLakeCPU和代号为"Battlemage"的下一代Arc独立显卡阵容。英特尔Xe2的部分目标是提高利用率、改善工作分配和减少软件开销。Xe2是一项从头开始的设计,修复了Xe"Alchemist"GPU存在的几个主要问题。一开始,英特尔就用一张IP性能效率图向观众展示了高达12.5倍的显著收益,让人惊叹不已。我们将深入介绍Xe2是什么,以及英特尔是如何实现这些收益的。英特尔表示,Xe2架构与Xe架构一样,具有高度的可扩展性,这将促使其集成到LunarLake等低功耗移动SoC中,并集成到稍后推出的具有独立选项的高端Arc显卡中。第二代Xe内核或Xe2配备了多种计算资源,这些资源被重新划分为本地SIMD16引擎,以提高效率。Xe2核心功能8个512位矢量引擎8个2048位XMX引擎支持64b原子运算192KB共享L1$/SLM矢量引擎也已更新,其中包括:SIMD16本地ALU-支持SIMD16和SIMD32操作Xe矩阵扩展(支持INT2、INT4、INT8、FP16、BF16)扩展数学和FP64-常数:正弦、余弦、对数、指数3向共同发行-FP+INT/EM+XMXAlchemist"Xe"GPU上也有Xe矩阵引擎或XMX单元,但现在的变化是,它们支持更多数据类型,运行速度更快,FP16额定频率为2048OPS/时钟,INT8额定频率为4096OPS/时钟。让我们来看看这些新引擎是如何在Xe2渲染片段(Xe2GPU的基本模块)中堆叠的。这些渲染片可根据需要进行堆叠和扩展,并经过优化,以减少延迟、消除停滞并改善硬件/软件握手。这些渲染片连接到命令前端,该命令前端本机支持间接执行。渲染片还包括一个新的几何引擎,具有3倍的顶点获取吞吐量和3倍的网格着色性能(具有顶点重用功能);新的L1$/SLM缓存,用于顺序外采样(具有压缩纹理);2倍的无过滤采样吞吐量和可编程偏移;一个新的HiZ单元,缓存增加了50%,并支持对小型基元进行早期HiZ剔除。最后,还有两个新的像素后端(PixelBackends),可提供两倍的混合吞吐量,像素颜色缓存增加了33%,并可将目标预取渲染至L2$。Xe2的最新光线跟踪单元在Xe1的基础上进行了改进。Xe2内核的一个主要部分是RTU(光线跟踪单元),它具有3条遍历管道、18个方框交叉点(每个方框交叉点6个,每个RTU3个方框)和2个三角形交叉点。以上就是英特尔Xe2GPU架构的基本概述:第2代Xe2内核增强型矢量引擎深度缓存新型XMX发动机性能和效率-优化前端本机硬件支持exectue间接命令更大的光线跟踪装置总体而言,英特尔的Xe2GPU架构旨在与游戏更加兼容,并实现更高的利用率。新的执行间接块被游戏用来加速绘制调用,由于它被虚幻引擎等引擎大量使用,因此获得12.5倍的提升对游戏玩家来说是个好兆头。第一款采用Xe2GPU的产品是集成配置的LunarLake。LunarLake中的多个区块都与GPU有关,如媒体引擎和显示引擎。在谈这些之前,我们先来谈谈LunarLake的Xe2配置:8个Xe2内核64个矢量引擎2几何管道8个采样器4个像素后端8个光线追踪单元8MBL2$LunarLakeXe2GPU有8个Xe2内核,每个Xe2内核有8个XMX和8个矢量单元、一个负载/存储单元、一个线程排序单元和一个专用的L1/L$缓存。这4个Xe2内核中的每一个都能生成一个渲染片。那么,与MeteorLake的XeGPU相比,这一切的性能表现如何呢?英特尔表示,Xe2GPU在ISO下的性能提高了50%,在性能不变的情况下,功耗大幅降低。XMX块也是一个重要部分,它涌入了67个峰值INT8TOPS,为LunarLakeCPU的整体AI能力锦上添花。该芯片总共提供120个平台TOPS,其中48个TOPS来自NPU4,5个TOPS来自CPU本身。月球湖的Xe显示引擎现在,我们从GPU转向LunarLakeCPU本身的其他模块,首先是显示引擎。显示引擎配备3个显示管道,最高支持8K60HDR,最高支持3x4K60HDR,最高支持1080p360或1440p360。显示引擎支持HDMI2.1、DisplayPort2.1和新的eDP1.5功能。显示引擎的前端包括解码/解密和流缓冲区。在像素处理流水线方面,每个流水线有6个平面,支持色彩转换和合成的硬件,同时具有灵活性和高能效。此外,还有一个额外的低功耗优化流水线,带有面板重放功能(空闲帧期间的功率门控)和一个带有LACE(本地自适应对比度增强)功能的全新亮度传感器。在压缩和编码方面,显示流压缩引擎支持31种视觉无损压缩和传输编码(HDMI和DisplayPort协议的流编码)。路由器和端口包括流组装和端口路由,最多支持4个端口,增加了灵活性。回到带有面板重放功能的eDP(eDisplayPort)1.5,它被称为面板自刷新的进化版,具有早期传输和自适应同步支持的选择性更新。新的显示功能可减少抖动,改善播放效果,同时提供更高的能效。用于LunarLake的Xe媒体引擎--支持VVC、侧缓存和更好的编码LunarLakeSOC与Xe2GPU连接的最后一个区块是媒体引擎,它现在拥有自己专用的8MB共享侧缓存。芯片的其他部分可以使用这个新缓存,但没有必要,因为其他内核本身就有专用缓存。这种侧缓存可为LunarLake节省大量带宽,因为跨媒体工作负载的系统内存流量减少了。这也大大降低了编码工作负载的功耗。媒体引擎支持最高达8k6010位HDR解码、高达8k6010位HDR编码、AVC、VP9、H.265HEVC、AV1和全新的VVC引擎。VVC引擎大大降低了比特率,同时提供与AV1相同的质量(文件大小最多减少10%)。它还支持自适应分辨率流和屏幕内容编码。最后,我们的WindowsGPU软件栈已经为Xe2GPU做好了准备。英特尔表示,它花了大量时间调整Alchemist"Xe"GPU的API级性能,尤其是DX9,但所有这些软件工作都将转移到Xe2,并支持所有最新的API和框架及其运行时。Xe2是一种全新的图形架构,它为LunarLake等集成解决方案和即将推出的ArcBattlemage系列的独立选项带来了巨大的性能提升和最新的功能集。公司将在今年晚些时候分享更多有关Battlemage独立产品的信息。...PC版:https://www.cnbeta.com.tw/articles/soft/1433526.htm手机版:https://m.cnbeta.com.tw/view/1433526.htm

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人