高通聘请了前AMD光追专家 以提升Adreno GPU游戏性能和兼容性

高通聘请了前AMD光追专家 以提升Adreno GPU游戏性能和兼容性 据TomsHardware报道,为了提升Adreno GPU的游戏性能,高通聘请了前AMD光线追踪专家Paritosh Kulkarni,加入到其GPU开发团队。据了解,Paritosh Kulkarni将针对Adreno GPU的DirectX 12.2支持展开工作,利用自己的专业知识来帮助完成相关的开发,包括DXR、网格着色器和驱动程序优化等。在AMD期间,Paritosh Kulkarni的工作范围覆盖渲染研究到直接为AMD图形芯片开发驱动程序,随后转向光线追踪领域,成为AMD内部在该领域的顶级专家之一,负责了ProRender、“HIP RT”光线追踪库和其他内部框架的开发。据高通的介绍,Adreno X1是适用于Windows on ARM的骁龙X系列SoC的第一代集成显卡,最多拥有6个着色器,共计1536个FP32 ALU,每周期能够处理96个纹理单元,提供了4.6 TFLOPS的峰值性能,每秒可处理7200万像素的数据。其支持主流的图形API,包括DirectX 12.1(Shader Model 6.7)、DirectX 11、Vulkan 1.3和OpenCL 3.0。虽然微软此前还推出了Automatic super resolution(Auto SR),为高通骁龙X系列在Windows游戏下的运行做了优化,但实际情况却不太理想。不少用户反映游戏在加载之前就崩溃了,即便是官方“Windows on Arm Ready Games”的游戏也可能会遇到各种问题,这都需要Paritosh Kulkarni去协助解决。 ... PC版: 手机版:

相关推荐

封面图片

高通骁龙 X Elite 处理器被指游戏性能不佳,兼容性问题严重

高通骁龙 X Elite 处理器被指游戏性能不佳,兼容性问题严重 作为参考,官方的“Windows on Arm 认证游戏”列表仅有 1259 款,其中许多都是要求不高的独立游戏和 2D 游戏。而使用 Linux 兼容工具 Valve Proton 的 Steam Deck,其通过验证的“可玩游戏”数量在去年 10 月份就已突破 12100 款,到目前为止已经增加到了 15391 款。

封面图片

高通公布骁龙X GPU架构细节:性能超67%、功耗低62%

高通公布骁龙X GPU架构细节:性能超67%、功耗低62% Adreno X1是专门针对Windows PC设计的,图形接口完整支持DirectX 12.1(Shader Model 6.7/DirectML)、DirectX 11、Vulkan 1.3、OpenCL 3.0,都有原生驱动支持。FP32单精度浮点性能最高4.6TFlops(每秒4.6万亿次计算),像素填充率最高72Gp/s(每秒720亿次)。如此详细的架构图对于高通GPU来说似乎还是第一次,可以看到分为6个着色处理器(SP),整体共计1536个FP32 ALU,可以通俗地表达为1536个核心,最高频率1.5GHz。粗暴地按照核心数计算,这相当于GTX 1660 Ti,或者说三个Arc A770,或者说四分之三个RX 7600。渲染前端模块支持每时钟周期2个三角形和光栅化处理、双向LRZ(地分辨率深度测试)、基于图像的可变着色率(VSR Tie2)。还有专门用于分箱(binning)的前端模块,与渲染同步运行。6个SP对应6个渲染后端,每时钟周期最多48个像素、96个fragment(用于MSAA抗锯齿)。另外还有GMU,也就是GPU管理单元,完整支持虚拟化(最多8个虚拟机),还有电源管理的作用。细看SP部分,也就是SIMD着色处理器,属于核心执行模块,分为两个uSPTP(微型着色与纹理流水线)。整个SP,分布着256个FP32 ALU(单精度浮点算术逻辑单元),支持FP32/16、INT32/16、BF16数据类型,支持DP4ACC指令(四路INT8点积),以及512个FP16 ALU(半精度浮点算术逻辑单元),支持FP16、INT16、BF16数据类型。此外,还有32个32位EFU(基本功能单元)、384KB GPR(通用寄存器)、指令缓存、本地缓冲、载入/存储单元、纹理流水线和纹理缓存、GMEM单元,等等。GPU内还集成了384KB集群缓存(每两个SP共享128KB)、1MB一体化二级缓存、6MB系统级缓存(即三级缓存),还有一些其他较小的缓存,用于着色器指令、本地纹理数据等。GMEM是个特殊功能单元,也就是高带宽的本地GPU显存,容量3MB,带宽达2TB/s,与系统内存完全异步。而且,它不仅仅是缓存,还可以全部或部分灵活地用于色彩与景深缓存、通用本地内存,无论是图形渲染还是通用计算都可以使用。它可以让GPU大大减少对系统内存的依赖,降低对延迟和带宽的需求,还有着超高的性能与能效。FlexRender弹性渲染技术也值得一提,可以由驱动控制,针对每一个不同的表面动态切换不同的渲染模式,提升性能的同时尽可能降低功耗。具体分为三种模式:一是Direct Mode,PC标准渲染方式,兼容性最好。二是Binned Mode,将每一帧画面切分为不同的区块(Tile),每一个都都会进入GMEM,可尽可能减少数据移动,提高能效。三是Bined Direct Mode,前述两种方式的混合。软件方面,高通承诺每月升级GPU驱动,Adreno控制面板可调节性能和各项功能,而在兼容性方面已经是数百款流行的Windows应用,已测试的游戏均可查询,还有丰富的开发工具。高通声称,Adreno X1对比酷睿Ultra的锐炫核显,同等功耗下性能领先最多67%,同等行下功耗低最多62%!对比锐龙9 7040系列中的Radeon 780M更是性能、能效都遥遥领先。在流行的3A游戏中,官方列出了9款,都基本持平或者优于Intel锐炫核显,优势项目包括《地平线:零之曙光》、《火箭联盟》等。 ... PC版: 手机版:

封面图片

美光PPT或泄露了RTX 5090性能 光追性能比4090提升48%

美光PPT或泄露了RTX 5090性能 光追性能比4090提升48% 美光的官方说法是,GDDR7最高比GDDR6快3.1倍,比GDDR6X快1.5倍。不过,该幻灯片还提供了在光线追踪和光栅化不同条件下的游戏性能数据。到目前为止,一切都很清楚了,接下来我们将根据以往的知识进行推测和假设,因此请谨慎对待。通过这些图表,外媒TechPowerUP猜测,英伟达RTX 5090在光栅化方面比RTX 4090提升了42%,而在光线追踪方面提升了48%。英伟达发布下一代GPU(RTX 5090)的时间越来越近了。美光与英伟达有着密切的合作伙伴关系,预计其下一代显卡将使用美光的GDDR7显存。现在,我们知道,一个现实的基准测试就是《赛博朋克2077》这个游戏,大胆推测这里的光追测试很有可能也是《赛博朋克2077》游戏。从图表来看,光线追踪看起来很像是使用路径追踪进行测试。而至于光栅化性能,另一个很难猜测的可能是《星空》或《刺客信条:幻景》。据推测,测试还使用了AMD RX 7900XTX和RTX 4090作为GDDR6以获得GDDR6的参考值。 ... PC版: 手机版:

封面图片

AMD Ryzen AI 9 300 GPU和CPU性能比上一代提升20%

AMD Ryzen AI 9 300 GPU和CPU性能比上一代提升20% 在 CPU 方面,HX 370 配备了由 4 个"Zen 5"和 8 个"Zen 5c"核心组合而成的 12 核/24 线程 CPU。除了更高的时钟速度外,"Zen 5"微架构的一代 IPC 也提高了单线程性能;而更多的核心则提高了多线程性能,这种性能提升并不是随着内核数增加 50%而线性扩展的。在"Hawk Point"上,所有八个核心都是"Zen 4",能够提升到高频率,其中两个被标记为 CPPC 首选核心,能够提升到最高频率。然而,在"Strix Point"上,只有四个核心基于"Zen 5"架构,能够提升到高频段;而其他八个是"Zen 5c",提升幅度没有那么高。虽然"Zen 5c"的 IPC 与"Zen 5"完全相同,但由于其提升幅度没有"Zen 5"那么高,这意味着核心数增加带来的多线程性能提升预计将接近 20%, Cinebench R23 nT 分数超过 20000 分,"Hawk Point"的分数约为 16000 分。图形方面的情况也很有趣。Strix Point"上的新 RDNA 3.5 iGPU 有 16 个计算单元(CU),而"Hawk Point"上只有 12 个 CU。这 16 个 CU 相当于 1024 个流处理器,比"Hawk Point"的 768 个流处理器增加了 33%,然而,除了 CU 数,还有许多其他因素决定着图形性能,因此预计图形性能将提高 20%,这将使新 iGPU 比酷睿 Ultra"Meteor Lake"处理器的英特尔 Arc Xe-LPG 图形处理器至少高出 20%。AMD 在其产品公告幻灯片中宣称,其图形性能比酷睿 Ultra 9 185H 处理器的 Arc Graphics iGPU 领先 36%。至于 NPU,AMD 已宣称其人工智能推理性能达到 50 TOPS,比微软 Copilot+ 人工智能 PC 计划要求的 40 TOPS 高出不少。Windows 需要这一数字的 NPU 性能来运行 Copilot 的本地会话,从而最大限度地减少本地与云端的来回切换,并提高隐私性。 ... PC版: 手机版:

封面图片

AMD GPU 也救不了三星? Exynos 2200 性能表现拉胯

AMD GPU 也救不了三星? Exynos 2200 性能表现拉胯 「用于测试的两款手机均为三星 S22 UItra,只是搭载的处理器不同,有一款使用 Exynos 2200,另外一款是高通新骁龙 8,现在要对比了一下它们的 GPU 图形性能。」

封面图片

AMD RDNA 4 GPU补丁将并入Mesa的RadeonSI Linux驱动程序

AMD RDNA 4 GPU补丁将并入Mesa的RadeonSI Linux驱动程序 我们已经有一段时间没有在 Linux 上看到多个 GFX12/RDNA 4 GPU 开发项目了,也没有看到 Red 团队如何使用"IP 块"来增强他们的方法。基于这一准备情况,我们可以期待在发布时对下一代 GPU 提供最佳支持。现在,Phoronix报道称,RDNA 4 GPU 启用的初期工作终于与 Linux 上的主流 Radeon 驱动程序合并,这表明我们确实接近正式发布的时间表,而且从目前的情况来看,AMD 已经为发布做好了一切准备。据透露,有 24 个补丁被合并到 Mesa 24.2-devel 中,其中大部分涉及平台的基本要素,如 AMD AC 代码、GFX12(RDNA 4 GPU)的 ADDRLIB 库代码,以及对 RadeonSI OpenGL 驱动程序的其他一些更改。由于这些补丁正在等待合并请求,我们没有看到任何新的或独特的内容;因此,我们就不详细介绍了。除此之外,AMD 还为其 RDNA 4 GPU 推出了VCN5(Video Codec Next)编码/解码功能:很高兴能看到这次AMD在 Linux 上启用 RDNA 和 Zen 架构时所采用的方法,因为从过去的情况来看,AMD 在推出补丁时表现得非常勉强,有些甚至是在正式发布几天后才推出。早期的补丁还揭示了 RDNA 4 GPU 的全新光线追踪功能,更多详情请点击此处。通过这些举措,AMD 准备将 Linux 支持提升到一个新的高度,与 MESA 的 RADVV ulkan 驱动程序等替代品展开竞争。 ... PC版: 手机版:

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人