微软新专利获批:利用固态硬盘提升光线追踪性能,降低显存占用https://www.ithome.com/0/757/839.ht

None

相关推荐

封面图片

微软下一代DXR光线追踪利用SSD限制游戏显存使用量 提供更高的性能

微软下一代DXR光线追踪利用SSD限制游戏显存使用量提供更高的性能越来越多的游戏利用光线追踪或路径追踪技术为玩家带来身临其境的逼真视觉效果,但这一切都需要付出代价。在"光线追踪加速结构细节级处理的系统和方法"一文中,微软公司指出,光线追踪及其相关加速结构是由软件编辑/生成的。他们正在竞相寻找存储解决方案,以实现更快的数据传输和细节处理。专利文档显示:作为视频游戏和其他此类应用的一部分,用于光线追踪的加速结构越来越多地由软件明确编辑或重新生成,以反映当前的潜在可见几何图形集。这些加速结构现在正与几何图形和纹理数据等其他数据竞争存储空间(包括持久存储空间(如闪存)和非持久存储空间(如RAM))。加速结构在内存中所占份额的增加,导致系统对内存的需求大大增加。此外,获取加速结构的大量数据所需的带宽也相应变大。本文介绍的系统和方法有助于最大限度地减少光线跟踪加速结构所需的空间。因此,需要有更好地处理与加速度结构相关数据的系统和方法。该专利列出了一些解决方案,例如与加速结构相关的更易于管理的数据池。这些数据既可以保存在内存中,也可以保存在固态硬盘等存储设备中。可以肯定的是,利用固态硬盘等更快的存储设备将有助于加速光线追踪性能。微软的DXRAPI可以与微软的DirectI/O套件协同工作,后者在充分利用硬盘/固态硬盘的潜力方面有着良好的记录。...PC版:https://www.cnbeta.com.tw/articles/soft/1424786.htm手机版:https://m.cnbeta.com.tw/view/1424786.htm

封面图片

微软新专利能降低光线追踪对GPU内存的需求,让8GB显卡重回游戏舞台

微软新专利能降低光线追踪对GPU内存的需求,让8GB显卡重回游戏舞台https://www.digitaltrends.com/computing/microsofts-new-patent-reduces-ray-tracing-requirements/微软发布了一项新专利,描述了一项能够显著减少光线追踪对GPU内存影响的技术。光线追踪是一种渲染技术,可以通过模拟光的物理行为来创建真实的光照效果,但它对GPU资源的需求非常高,尤其是内存。这项新的专利描述了一种使光线追踪更有效率的方法,这样一来,那些内存较小的显卡,比如只有8GB视频内存的,也能再次用于游戏和其他高端图形任务。这一创新可以对光线追踪技术的整体性能和可获得性产生深远影响,可能允许更多用户在不需要高端昂贵硬件的情况下,享受其带来的好处。

封面图片

美光“秀肌肉”:光线追踪游戏测试GDDR7显存性能是GDDR6的3.1倍-IT之家https://www.ithome.com/

封面图片

并非所有第一代PCIe 5.0固态硬盘都能提供相同的性能

并非所有第一代PCIe5.0固态硬盘都能提供相同的性能随着Intel、AMD桌面平台陆续支持PCIe5.0,SSD也迎来了新的时代。不过大家可能发现了,之前宣布的各种企业级PCIe5.0SSD,标称性能普遍都能达到14GB/s、10GB/s的读写速度,而近期陆续出现的桌面级产品,却没有那么快,读取基本都在10GB/s。PC版:https://www.cnbeta.com/articles/soft/1314623.htm手机版:https://m.cnbeta.com/view/1314623.htm

封面图片

消息称PS5 Pro延续1TB固态硬盘以降低成本

消息称PS5Pro延续1TB固态硬盘以降低成本PS5Pro的其他硬件规格也显示出了一系列强大的性能提升,包括更高的CPU时钟频率、更快的内存带宽、更强大的图形渲染能力和更先进的人工智能加速器等等。这些升级将为玩家带来更流畅、更逼真的游戏体验。然而,对于是否延续1TB固态硬盘的决定引起了一些争议。有些玩家认为,虽然固态硬盘的容量足够大,但随着游戏的不断进化和升级,可能会出现存储空间紧张的问题。而另一些玩家则认为,保留1TB固态硬盘可以降低PS5Pro的售价,让更多玩家能够接触到高性能的游戏主机。目前,索尼尚未对PS5Pro的存在进行正式确认,因此关于这一消息的真实性仍然存在一定的不确定性。我们需要等待索尼的官方公告,以获取更多关于PS5Pro的具体信息和定价等方面的细节。...PC版:https://www.cnbeta.com.tw/articles/soft/1424037.htm手机版:https://m.cnbeta.com.tw/view/1424037.htm

封面图片

英特尔Xe2 GPU正式发布:性能提升 50% 包含全新光线追踪内核

英特尔Xe2GPU正式发布:性能提升50%包含全新光线追踪内核英特尔Xe2正式发布,并将应用于LunarLakeCPU和代号为"Battlemage"的下一代Arc独立显卡阵容。英特尔Xe2的部分目标是提高利用率、改善工作分配和减少软件开销。Xe2是一项从头开始的设计,修复了Xe"Alchemist"GPU存在的几个主要问题。一开始,英特尔就用一张IP性能效率图向观众展示了高达12.5倍的显著收益,让人惊叹不已。我们将深入介绍Xe2是什么,以及英特尔是如何实现这些收益的。英特尔表示,Xe2架构与Xe架构一样,具有高度的可扩展性,这将促使其集成到LunarLake等低功耗移动SoC中,并集成到稍后推出的具有独立选项的高端Arc显卡中。第二代Xe内核或Xe2配备了多种计算资源,这些资源被重新划分为本地SIMD16引擎,以提高效率。Xe2核心功能8个512位矢量引擎8个2048位XMX引擎支持64b原子运算192KB共享L1$/SLM矢量引擎也已更新,其中包括:SIMD16本地ALU-支持SIMD16和SIMD32操作Xe矩阵扩展(支持INT2、INT4、INT8、FP16、BF16)扩展数学和FP64-常数:正弦、余弦、对数、指数3向共同发行-FP+INT/EM+XMXAlchemist"Xe"GPU上也有Xe矩阵引擎或XMX单元,但现在的变化是,它们支持更多数据类型,运行速度更快,FP16额定频率为2048OPS/时钟,INT8额定频率为4096OPS/时钟。让我们来看看这些新引擎是如何在Xe2渲染片段(Xe2GPU的基本模块)中堆叠的。这些渲染片可根据需要进行堆叠和扩展,并经过优化,以减少延迟、消除停滞并改善硬件/软件握手。这些渲染片连接到命令前端,该命令前端本机支持间接执行。渲染片还包括一个新的几何引擎,具有3倍的顶点获取吞吐量和3倍的网格着色性能(具有顶点重用功能);新的L1$/SLM缓存,用于顺序外采样(具有压缩纹理);2倍的无过滤采样吞吐量和可编程偏移;一个新的HiZ单元,缓存增加了50%,并支持对小型基元进行早期HiZ剔除。最后,还有两个新的像素后端(PixelBackends),可提供两倍的混合吞吐量,像素颜色缓存增加了33%,并可将目标预取渲染至L2$。Xe2的最新光线跟踪单元在Xe1的基础上进行了改进。Xe2内核的一个主要部分是RTU(光线跟踪单元),它具有3条遍历管道、18个方框交叉点(每个方框交叉点6个,每个RTU3个方框)和2个三角形交叉点。以上就是英特尔Xe2GPU架构的基本概述:第2代Xe2内核增强型矢量引擎深度缓存新型XMX发动机性能和效率-优化前端本机硬件支持exectue间接命令更大的光线跟踪装置总体而言,英特尔的Xe2GPU架构旨在与游戏更加兼容,并实现更高的利用率。新的执行间接块被游戏用来加速绘制调用,由于它被虚幻引擎等引擎大量使用,因此获得12.5倍的提升对游戏玩家来说是个好兆头。第一款采用Xe2GPU的产品是集成配置的LunarLake。LunarLake中的多个区块都与GPU有关,如媒体引擎和显示引擎。在谈这些之前,我们先来谈谈LunarLake的Xe2配置:8个Xe2内核64个矢量引擎2几何管道8个采样器4个像素后端8个光线追踪单元8MBL2$LunarLakeXe2GPU有8个Xe2内核,每个Xe2内核有8个XMX和8个矢量单元、一个负载/存储单元、一个线程排序单元和一个专用的L1/L$缓存。这4个Xe2内核中的每一个都能生成一个渲染片。那么,与MeteorLake的XeGPU相比,这一切的性能表现如何呢?英特尔表示,Xe2GPU在ISO下的性能提高了50%,在性能不变的情况下,功耗大幅降低。XMX块也是一个重要部分,它涌入了67个峰值INT8TOPS,为LunarLakeCPU的整体AI能力锦上添花。该芯片总共提供120个平台TOPS,其中48个TOPS来自NPU4,5个TOPS来自CPU本身。月球湖的Xe显示引擎现在,我们从GPU转向LunarLakeCPU本身的其他模块,首先是显示引擎。显示引擎配备3个显示管道,最高支持8K60HDR,最高支持3x4K60HDR,最高支持1080p360或1440p360。显示引擎支持HDMI2.1、DisplayPort2.1和新的eDP1.5功能。显示引擎的前端包括解码/解密和流缓冲区。在像素处理流水线方面,每个流水线有6个平面,支持色彩转换和合成的硬件,同时具有灵活性和高能效。此外,还有一个额外的低功耗优化流水线,带有面板重放功能(空闲帧期间的功率门控)和一个带有LACE(本地自适应对比度增强)功能的全新亮度传感器。在压缩和编码方面,显示流压缩引擎支持31种视觉无损压缩和传输编码(HDMI和DisplayPort协议的流编码)。路由器和端口包括流组装和端口路由,最多支持4个端口,增加了灵活性。回到带有面板重放功能的eDP(eDisplayPort)1.5,它被称为面板自刷新的进化版,具有早期传输和自适应同步支持的选择性更新。新的显示功能可减少抖动,改善播放效果,同时提供更高的能效。用于LunarLake的Xe媒体引擎--支持VVC、侧缓存和更好的编码LunarLakeSOC与Xe2GPU连接的最后一个区块是媒体引擎,它现在拥有自己专用的8MB共享侧缓存。芯片的其他部分可以使用这个新缓存,但没有必要,因为其他内核本身就有专用缓存。这种侧缓存可为LunarLake节省大量带宽,因为跨媒体工作负载的系统内存流量减少了。这也大大降低了编码工作负载的功耗。媒体引擎支持最高达8k6010位HDR解码、高达8k6010位HDR编码、AVC、VP9、H.265HEVC、AV1和全新的VVC引擎。VVC引擎大大降低了比特率,同时提供与AV1相同的质量(文件大小最多减少10%)。它还支持自适应分辨率流和屏幕内容编码。最后,我们的WindowsGPU软件栈已经为Xe2GPU做好了准备。英特尔表示,它花了大量时间调整Alchemist"Xe"GPU的API级性能,尤其是DX9,但所有这些软件工作都将转移到Xe2,并支持所有最新的API和框架及其运行时。Xe2是一种全新的图形架构,它为LunarLake等集成解决方案和即将推出的ArcBattlemage系列的独立选项带来了巨大的性能提升和最新的功能集。公司将在今年晚些时候分享更多有关Battlemage独立产品的信息。...PC版:https://www.cnbeta.com.tw/articles/soft/1433526.htm手机版:https://m.cnbeta.com.tw/view/1433526.htm

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人