DirectStorage基准测试显示出明确的传输速度改进

DirectStorage基准测试显示出明确的传输速度改进来自PCGamesHardware的测试显示,微软的DirectStorageAPI可以帮助NVMeSSD加载游戏素材的速度明显快于SATASSD。他们还提供了基于GPU的解压比CPU解压的巨大优势。该网站在SATASSD、PCIe3.0NVMeSSD和PCIe4.0NVMe上运行微软公开的Avocado加载DirectStorage演示。它还比较了三个GPU和CPU之间的解压速度--AMDRadeonRX7900XT、IntelArcA770、NVIDIAGeForceRTX4080和5.2GHzInteli9-12900K。下图显示了每个硬件配置的传输率,单位为GB/s,显示了五个测试中的平均结果。在这里,NVMe固态硬盘比SATA固态硬盘快几倍,而PCIe4.0比PCIe3.0有着些许优势。可能最奇怪的是,A770在GPU解压方面超过了RX7900XT和4080,尽管它在游戏性能方面居于下风。演示中的截图显示了CPU和GPU解压之间的差异。一些截图显示,几千兆字节的素材需要1.5秒到5秒的时间来加载,CPU利用率在30%到100%之间。另一些显示同样的素材在半秒左右加载,CPU利用率不到5%,表明GPU已经接管了这项工作。该演示显示了微软实验室以外的硬件有希望的早期结果。此外,他们展示了2020年测试的巨大转变,显示最近的游戏没有充分利用NVMs比SATA驱动器的带宽优势。在3月的GDC上,SquareEnix声称DirectStorage让Forspoken在NVMeSSD上加载新场景和环境的时间不到2秒,而在SATASSD上需要几秒,在HDD上需要近半分钟。微软设计了新的API,用于Windows11。由于其传统的存储堆栈,Windows10系统将只能看到有限的好处。...PC版:https://www.cnbeta.com.tw/articles/soft/1339065.htm手机版:https://m.cnbeta.com.tw/view/1339065.htm

相关推荐

封面图片

微软DirectStorage 1.1到来 通过GPU解压步骤缩短PC游戏加载时间

微软DirectStorage1.1到来通过GPU解压步骤缩短PC游戏加载时间GPU解压的工作原理是将游戏中解压资产包所需的工作转移到到显卡而不是CPU上。现在,游戏资产通常在打包分发时被压缩,然后在游戏开始后被解压。问题是,大多数压缩技术都是为CPU设计的,这对于那些想用最新的PC硬件推动更快的解压速度的现代游戏来说并不理想。"通常情况下,解压工作是在CPU上完成的,因为压缩格式在历史上只为CPU优化,"微软的高级项目经理CassieHoef解释说。"我们在DirectStorage1.1中提供了一种替代方法,将这些资产的解压工作改在GPU上进行--称为GPU解压。"近年来,我们看到行业已经转向PCIeGen3或Gen4NVMe存储设备,最高可提供7GB/s的数据带宽。这种快速存储对于想要加快加载时间的游戏开发者来说是个好消息,I/O技术的进步可以极大地加快加载时间和使用DirectStorage1.1的游戏。开发人员现在需要调整他们的游戏,以利用DirectStorage1.1,这些改进甚至可以看到游戏内部的巨大变化,即你从一个世界移动到另一个世界或在地图或世界的不同部分之间传送。微软声称这可以快三倍,同时释放出CPU来处理其他游戏进程。NVIDIA在目前的GameReadyDriver(526.47版)中实现了RTXIO从而利用了DirectStorage1.1的优势。AMD正在与其软件供应商合作,以最终确定其驱动程序,而英特尔最新的Arc图形驱动程序(101.3793)已经包括其自己对DirectStorage1.1的优化。我们剩下需要的是游戏支持。DirectStorage一直承诺会有极快的加载时间,我们在XboxSeriesX游戏机上看到了这种情况,但我们还没有看到许多PC游戏采用这种技术。也许GPU解压将推动游戏开发者真正利用DirectStorage的优势。 Forspoken应该是第一个支持DirectStorage的大型游戏,但该游戏被推迟到了2023年1月。...PC版:https://www.cnbeta.com.tw/articles/soft/1332319.htm手机版:https://m.cnbeta.com.tw/view/1332319.htm

封面图片

微软预告DirectStorage 1.1版本 新方案可带来三倍GPU解压速率

微软预告DirectStorage1.1版本新方案可带来三倍GPU解压速率在周四的一篇DirectX开发者博客中,微软员工CassieHoef详细介绍了即将到来的DirectStorage1.1新特性。其中最吸引眼球的,莫过于它能够利用新的GPU解压缩方案、带来三倍的加载速度提升。据悉,传统解压需要在中央处理器(CPU)上进行,但通过将之移交给图形处理器(GPU)、还将获得更加巨大的益处。PC版:https://www.cnbeta.com/articles/soft/1327109.htm手机版:https://m.cnbeta.com/view/1327109.htm

封面图片

英特尔A770和A750基准测试 在OpenCL和Vulkan API上显示出改进

英特尔A770和A750基准测试在OpenCL和VulkanAPI上显示出改进Intel将在10月5日晚上21点开放ArcA770、ArcA750显卡的性能评测,这也是Intel第一代全新独立显卡的两款顶级型号,定位竞品是……RTX3060。GeekBench数据库里已经出现了它们的跑分成绩,嗯,不太好看。PC版:https://www.cnbeta.com/articles/soft/1323203.htm手机版:https://m.cnbeta.com/view/1323203.htm

封面图片

高通Snapdragon X Plus将配备10核CPU集群 基准测试显示不同结果

高通SnapdragonXPlus将配备10核CPU集群基准测试显示不同结果@faridofanani96在X上发布了"Geekbench6分数"链接,显示骁龙XPlus在ML或机器学习基准测试中获得了不同的分数。不管是哪种基准测试,据说该芯片组采用的是"平衡"电源方案,拥有10核CPU集群,其中6核为性能核心,其余4核可能是为提高能效而设计的。相比之下,SnapdragonXElite采用的是12核集群和8个性能核心。在这两项测试结果中,骁龙XPlus分别获得了1,903和2,410的分数但我们早些时候曾报道过,高通公司正在准备两个版本的骁龙XPlus,这样就会出现我们现在看到的不同结果。10核CPU集群意味着该芯片在多线程应用中的性能会比SnapdragonXElite慢一些,但也慢不了多少,因为两款芯片组之间的差距只有两个核心。不过,我们可能会看到实际转化为产品之后会出现其他方面的差异,如设备上的人工智能、不同的集成5G调制解调器以及其他变化。据悉,高通公司将于4月24日正式发布骁龙XElite和骁龙XPlus,届时我们将展示这两款芯片组之间的所有差异,敬请期待。...PC版:https://www.cnbeta.com.tw/articles/soft/1428211.htm手机版:https://m.cnbeta.com.tw/view/1428211.htm

封面图片

基准测试显示苹果M2 Max与M1 Max相比性能提升达10%

基准测试显示苹果M2Max与M1Max相比性能提升达10%针对高端领域的CPU不会是苹果阵容中最好的,因为这个位置仍将由苹果的M2UltraCPU占据,该CPU将于2023年晚些时候推出。归各方面,苹果M2MaxCPU将提供总共12个核心,与M1Max的最大为10个核心相比增加了2个核心。我们还不能确定具体的性能和效率核心配置会是什么。CPU的基本频率为3.54GHz,配备了4MB的二级缓存。在这台特定的Mac上还有96GB的板载内存。至于最大时钟速度,根据Geekbench的报告,该芯片的峰值约为3.7GHz。苹果M2Max的CPU在单核和多核测试中得到1889分和14586分。相比之下,苹果M1Max的单核得分约为1750分,多核测试为12200分。这使M2Max的单线程和多线程性能比上一代CPU提高了10%,这是一个不错的收获。但这个成绩只是来自于早期的泄漏,意味着仍有改进的余地,我们大概率可以看到在最终的基准测试中,会有更多好成绩出现。当与一些现代CPU如英特尔的Corei9-13900K"RaptorLake"和AMD的Ryzen7000"Zen4"相比,苹果M2Max在单线程和多线程数字上都被碾压,因为这些大功率的桌面CPU的单核性能可超过2000分,在多线程基准中超过20000分。苹果很可能会在这些芯片面前炫耀它的能耗优势,而M2Ultra将会尽可能地在性能方面接近现代的x86部件。...PC版:https://www.cnbeta.com.tw/articles/soft/1334033.htm手机版:https://m.cnbeta.com.tw/view/1334033.htm

封面图片

LLaMA 在 CPU 上的运行速度显著改进

LLaMA在CPU上的运行速度显著改进大模型如LLaMA通常需要高端GPU才能流畅运行。Mozilla支持的项目旨在本地运行大模型。开发者刚刚为llamafile编写了84个新的矩阵乘法内核,显著改进了CPU运行性能,让普通CPU流畅运行大模型成为可能。ARMv8.2+(如RaspberryPi5)、英特尔CPU以及支持AVX512指令集的AMDZen4CPU上的运行速度增幅最为突出。来源,频道:@kejiqu群组:@kejiquchat

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人