高通聘请了前AMD光追专家 以提升Adreno GPU游戏性能和兼容性

高通聘请了前AMD光追专家 以提升Adreno GPU游戏性能和兼容性 据TomsHardware报道,为了提升Adreno GPU的游戏性能,高通聘请了前AMD光线追踪专家Paritosh Kulkarni,加入到其GPU开发团队。据了解,Paritosh Kulkarni将针对Adreno GPU的DirectX 12.2支持展开工作,利用自己的专业知识来帮助完成相关的开发,包括DXR、网格着色器和驱动程序优化等。在AMD期间,Paritosh Kulkarni的工作范围覆盖渲染研究到直接为AMD图形芯片开发驱动程序,随后转向光线追踪领域,成为AMD内部在该领域的顶级专家之一,负责了ProRender、“HIP RT”光线追踪库和其他内部框架的开发。据高通的介绍,Adreno X1是适用于Windows on ARM的骁龙X系列SoC的第一代集成显卡,最多拥有6个着色器,共计1536个FP32 ALU,每周期能够处理96个纹理单元,提供了4.6 TFLOPS的峰值性能,每秒可处理7200万像素的数据。其支持主流的图形API,包括DirectX 12.1(Shader Model 6.7)、DirectX 11、Vulkan 1.3和OpenCL 3.0。虽然微软此前还推出了Automatic super resolution(Auto SR),为高通骁龙X系列在Windows游戏下的运行做了优化,但实际情况却不太理想。不少用户反映游戏在加载之前就崩溃了,即便是官方“Windows on Arm Ready Games”的游戏也可能会遇到各种问题,这都需要Paritosh Kulkarni去协助解决。 ... PC版: 手机版:

相关推荐

封面图片

高通骁龙 X Elite 处理器被指游戏性能不佳,兼容性问题严重

高通骁龙 X Elite 处理器被指游戏性能不佳,兼容性问题严重 作为参考,官方的“Windows on Arm 认证游戏”列表仅有 1259 款,其中许多都是要求不高的独立游戏和 2D 游戏。而使用 Linux 兼容工具 Valve Proton 的 Steam Deck,其通过验证的“可玩游戏”数量在去年 10 月份就已突破 12100 款,到目前为止已经增加到了 15391 款。

封面图片

高通公布骁龙X GPU架构细节:性能超67%、功耗低62%

高通公布骁龙X GPU架构细节:性能超67%、功耗低62% Adreno X1是专门针对Windows PC设计的,图形接口完整支持DirectX 12.1(Shader Model 6.7/DirectML)、DirectX 11、Vulkan 1.3、OpenCL 3.0,都有原生驱动支持。FP32单精度浮点性能最高4.6TFlops(每秒4.6万亿次计算),像素填充率最高72Gp/s(每秒720亿次)。如此详细的架构图对于高通GPU来说似乎还是第一次,可以看到分为6个着色处理器(SP),整体共计1536个FP32 ALU,可以通俗地表达为1536个核心,最高频率1.5GHz。粗暴地按照核心数计算,这相当于GTX 1660 Ti,或者说三个Arc A770,或者说四分之三个RX 7600。渲染前端模块支持每时钟周期2个三角形和光栅化处理、双向LRZ(地分辨率深度测试)、基于图像的可变着色率(VSR Tie2)。还有专门用于分箱(binning)的前端模块,与渲染同步运行。6个SP对应6个渲染后端,每时钟周期最多48个像素、96个fragment(用于MSAA抗锯齿)。另外还有GMU,也就是GPU管理单元,完整支持虚拟化(最多8个虚拟机),还有电源管理的作用。细看SP部分,也就是SIMD着色处理器,属于核心执行模块,分为两个uSPTP(微型着色与纹理流水线)。整个SP,分布着256个FP32 ALU(单精度浮点算术逻辑单元),支持FP32/16、INT32/16、BF16数据类型,支持DP4ACC指令(四路INT8点积),以及512个FP16 ALU(半精度浮点算术逻辑单元),支持FP16、INT16、BF16数据类型。此外,还有32个32位EFU(基本功能单元)、384KB GPR(通用寄存器)、指令缓存、本地缓冲、载入/存储单元、纹理流水线和纹理缓存、GMEM单元,等等。GPU内还集成了384KB集群缓存(每两个SP共享128KB)、1MB一体化二级缓存、6MB系统级缓存(即三级缓存),还有一些其他较小的缓存,用于着色器指令、本地纹理数据等。GMEM是个特殊功能单元,也就是高带宽的本地GPU显存,容量3MB,带宽达2TB/s,与系统内存完全异步。而且,它不仅仅是缓存,还可以全部或部分灵活地用于色彩与景深缓存、通用本地内存,无论是图形渲染还是通用计算都可以使用。它可以让GPU大大减少对系统内存的依赖,降低对延迟和带宽的需求,还有着超高的性能与能效。FlexRender弹性渲染技术也值得一提,可以由驱动控制,针对每一个不同的表面动态切换不同的渲染模式,提升性能的同时尽可能降低功耗。具体分为三种模式:一是Direct Mode,PC标准渲染方式,兼容性最好。二是Binned Mode,将每一帧画面切分为不同的区块(Tile),每一个都都会进入GMEM,可尽可能减少数据移动,提高能效。三是Bined Direct Mode,前述两种方式的混合。软件方面,高通承诺每月升级GPU驱动,Adreno控制面板可调节性能和各项功能,而在兼容性方面已经是数百款流行的Windows应用,已测试的游戏均可查询,还有丰富的开发工具。高通声称,Adreno X1对比酷睿Ultra的锐炫核显,同等功耗下性能领先最多67%,同等行下功耗低最多62%!对比锐龙9 7040系列中的Radeon 780M更是性能、能效都遥遥领先。在流行的3A游戏中,官方列出了9款,都基本持平或者优于Intel锐炫核显,优势项目包括《地平线:零之曙光》、《火箭联盟》等。 ... PC版: 手机版:

封面图片

美光PPT或泄露了RTX 5090性能 光追性能比4090提升48%

美光PPT或泄露了RTX 5090性能 光追性能比4090提升48% 美光的官方说法是,GDDR7最高比GDDR6快3.1倍,比GDDR6X快1.5倍。不过,该幻灯片还提供了在光线追踪和光栅化不同条件下的游戏性能数据。到目前为止,一切都很清楚了,接下来我们将根据以往的知识进行推测和假设,因此请谨慎对待。通过这些图表,外媒TechPowerUP猜测,英伟达RTX 5090在光栅化方面比RTX 4090提升了42%,而在光线追踪方面提升了48%。英伟达发布下一代GPU(RTX 5090)的时间越来越近了。美光与英伟达有着密切的合作伙伴关系,预计其下一代显卡将使用美光的GDDR7显存。现在,我们知道,一个现实的基准测试就是《赛博朋克2077》这个游戏,大胆推测这里的光追测试很有可能也是《赛博朋克2077》游戏。从图表来看,光线追踪看起来很像是使用路径追踪进行测试。而至于光栅化性能,另一个很难猜测的可能是《星空》或《刺客信条:幻景》。据推测,测试还使用了AMD RX 7900XTX和RTX 4090作为GDDR6以获得GDDR6的参考值。 ... PC版: 手机版:

封面图片

AMD GPU 也救不了三星? Exynos 2200 性能表现拉胯

AMD GPU 也救不了三星? Exynos 2200 性能表现拉胯 「用于测试的两款手机均为三星 S22 UItra,只是搭载的处理器不同,有一款使用 Exynos 2200,另外一款是高通新骁龙 8,现在要对比了一下它们的 GPU 图形性能。」

封面图片

高通骁龙 X Elite 笔记本电脑与许多游戏存在兼容性问题

高通骁龙 X Elite 笔记本电脑与许多游戏存在兼容性问题 经过数月的宣传,搭载高通骁龙 X Elite 处理器的 Windows on Arm 笔记本电脑终于面世。高通承诺与 Windows 游戏“完美”兼容,虽然某些游戏确实在硬件上运行良好,但骁龙 X Elite 与竞争对手 AMD/Intel iGPU 之间的性能差距还是很大。而且这还只是当游戏真正开始运行时才会发生但通常情况下游戏都无法正常运行。作为参考,官方的“ 认证游戏”列表仅有1259款,其中许多都是要求不高的独立游戏和 2D 游戏。而使用 Linux 兼容工具 Valve Proton 的 Steam Deck 掌机已超过15,391款经过验证且可玩的游戏。

封面图片

微软介绍DirectSR API 基于AMD FSR 2.2.2开发

微软介绍DirectSR API 基于AMD FSR 2.2.2开发 3 月 21 日星期四,微软 Direct3D 部门开发经理 Shawn Hargreaves 在 Moscone 中心西厅 2009 室上台介绍了微软 DirectSR。Hargreaves 指出,现在的 PC 游戏都希望能立即支持多种插帧技术(想想 AMD FSR 或 NVIDIA DLSS 在游戏中缺失时的争议就知道了,比如《星际争霸》),而且平台希望将更新、改进的技术应用到现有游戏中。这些正是 DirectX 一直以来要为开发者解决的问题。因此,微软需要 DirectSR,它被描述为一种新的 DirectX 应用程序接口,通过一个标准接口抽象出多种超分辨率技术。内置变体将作为 Direct SuperResolution 的一部分提供,并将在所有硬件上使用,而其他变体将专门针对特定的 GPU/NPU 硬件。所有可用的技术都将枚举出来,允许开发人员选择他们想要的技术。Microsoft DirectSR 将在应用程序提供的计算队列中提交执行,用户界面将在顶部渲染后正常呈现。由于 AMD Fidelity FX Super Resolution 2 最初是作为通用着色器程序编写的,可以在任何支持 Compute Shader 6.2 的显卡上运行,因此微软决定将 AMD FSR2 的核心处理集成到 DirectSR 运行时中。因此,只要开发人员准备好所需的预处理和参数,他们的游戏就能无缝运行,而无需编写特定的 FSR2 代码。会上还讨论了DirectX的工作图(Work Graphs),它现在已经发布了预览版。不过,微软 DirectSR 的推出还需要更多时间。目前还没有关于何时推出的消息,但通过 Agility SDK 公开预览版应该很快就会推出。 ... PC版: 手机版:

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人