高通聘请了前AMD光追专家 以提升Adreno GPU游戏性能和兼容性

高通聘请了前AMD光追专家 以提升Adreno GPU游戏性能和兼容性 据TomsHardware报道,为了提升Adreno GPU的游戏性能,高通聘请了前AMD光线追踪专家Paritosh Kulkarni,加入到其GPU开发团队。据了解,Paritosh Kulkarni将针对Adreno GPU的DirectX 12.2支持展开工作,利用自己的专业知识来帮助完成相关的开发,包括DXR、网格着色器和驱动程序优化等。在AMD期间,Paritosh Kulkarni的工作范围覆盖渲染研究到直接为AMD图形芯片开发驱动程序,随后转向光线追踪领域,成为AMD内部在该领域的顶级专家之一,负责了ProRender、“HIP RT”光线追踪库和其他内部框架的开发。据高通的介绍,Adreno X1是适用于Windows on ARM的骁龙X系列SoC的第一代集成显卡,最多拥有6个着色器,共计1536个FP32 ALU,每周期能够处理96个纹理单元,提供了4.6 TFLOPS的峰值性能,每秒可处理7200万像素的数据。其支持主流的图形API,包括DirectX 12.1(Shader Model 6.7)、DirectX 11、Vulkan 1.3和OpenCL 3.0。虽然微软此前还推出了Automatic super resolution(Auto SR),为高通骁龙X系列在Windows游戏下的运行做了优化,但实际情况却不太理想。不少用户反映游戏在加载之前就崩溃了,即便是官方“Windows on Arm Ready Games”的游戏也可能会遇到各种问题,这都需要Paritosh Kulkarni去协助解决。 ... PC版: 手机版:

相关推荐

封面图片

美光PPT或泄露了RTX 5090性能 光追性能比4090提升48%

美光PPT或泄露了RTX 5090性能 光追性能比4090提升48% 美光的官方说法是,GDDR7最高比GDDR6快3.1倍,比GDDR6X快1.5倍。不过,该幻灯片还提供了在光线追踪和光栅化不同条件下的游戏性能数据。到目前为止,一切都很清楚了,接下来我们将根据以往的知识进行推测和假设,因此请谨慎对待。通过这些图表,外媒TechPowerUP猜测,英伟达RTX 5090在光栅化方面比RTX 4090提升了42%,而在光线追踪方面提升了48%。英伟达发布下一代GPU(RTX 5090)的时间越来越近了。美光与英伟达有着密切的合作伙伴关系,预计其下一代显卡将使用美光的GDDR7显存。现在,我们知道,一个现实的基准测试就是《赛博朋克2077》这个游戏,大胆推测这里的光追测试很有可能也是《赛博朋克2077》游戏。从图表来看,光线追踪看起来很像是使用路径追踪进行测试。而至于光栅化性能,另一个很难猜测的可能是《星空》或《刺客信条:幻景》。据推测,测试还使用了AMD RX 7900XTX和RTX 4090作为GDDR6以获得GDDR6的参考值。 ... PC版: 手机版:

封面图片

AMD GPU 也救不了三星? Exynos 2200 性能表现拉胯

AMD GPU 也救不了三星? Exynos 2200 性能表现拉胯 「用于测试的两款手机均为三星 S22 UItra,只是搭载的处理器不同,有一款使用 Exynos 2200,另外一款是高通新骁龙 8,现在要对比了一下它们的 GPU 图形性能。」

封面图片

高通公布骁龙X GPU架构细节:性能超67%、功耗低62%

高通公布骁龙X GPU架构细节:性能超67%、功耗低62% Adreno X1是专门针对Windows PC设计的,图形接口完整支持DirectX 12.1(Shader Model 6.7/DirectML)、DirectX 11、Vulkan 1.3、OpenCL 3.0,都有原生驱动支持。FP32单精度浮点性能最高4.6TFlops(每秒4.6万亿次计算),像素填充率最高72Gp/s(每秒720亿次)。如此详细的架构图对于高通GPU来说似乎还是第一次,可以看到分为6个着色处理器(SP),整体共计1536个FP32 ALU,可以通俗地表达为1536个核心,最高频率1.5GHz。粗暴地按照核心数计算,这相当于GTX 1660 Ti,或者说三个Arc A770,或者说四分之三个RX 7600。渲染前端模块支持每时钟周期2个三角形和光栅化处理、双向LRZ(地分辨率深度测试)、基于图像的可变着色率(VSR Tie2)。还有专门用于分箱(binning)的前端模块,与渲染同步运行。6个SP对应6个渲染后端,每时钟周期最多48个像素、96个fragment(用于MSAA抗锯齿)。另外还有GMU,也就是GPU管理单元,完整支持虚拟化(最多8个虚拟机),还有电源管理的作用。细看SP部分,也就是SIMD着色处理器,属于核心执行模块,分为两个uSPTP(微型着色与纹理流水线)。整个SP,分布着256个FP32 ALU(单精度浮点算术逻辑单元),支持FP32/16、INT32/16、BF16数据类型,支持DP4ACC指令(四路INT8点积),以及512个FP16 ALU(半精度浮点算术逻辑单元),支持FP16、INT16、BF16数据类型。此外,还有32个32位EFU(基本功能单元)、384KB GPR(通用寄存器)、指令缓存、本地缓冲、载入/存储单元、纹理流水线和纹理缓存、GMEM单元,等等。GPU内还集成了384KB集群缓存(每两个SP共享128KB)、1MB一体化二级缓存、6MB系统级缓存(即三级缓存),还有一些其他较小的缓存,用于着色器指令、本地纹理数据等。GMEM是个特殊功能单元,也就是高带宽的本地GPU显存,容量3MB,带宽达2TB/s,与系统内存完全异步。而且,它不仅仅是缓存,还可以全部或部分灵活地用于色彩与景深缓存、通用本地内存,无论是图形渲染还是通用计算都可以使用。它可以让GPU大大减少对系统内存的依赖,降低对延迟和带宽的需求,还有着超高的性能与能效。FlexRender弹性渲染技术也值得一提,可以由驱动控制,针对每一个不同的表面动态切换不同的渲染模式,提升性能的同时尽可能降低功耗。具体分为三种模式:一是Direct Mode,PC标准渲染方式,兼容性最好。二是Binned Mode,将每一帧画面切分为不同的区块(Tile),每一个都都会进入GMEM,可尽可能减少数据移动,提高能效。三是Bined Direct Mode,前述两种方式的混合。软件方面,高通承诺每月升级GPU驱动,Adreno控制面板可调节性能和各项功能,而在兼容性方面已经是数百款流行的Windows应用,已测试的游戏均可查询,还有丰富的开发工具。高通声称,Adreno X1对比酷睿Ultra的锐炫核显,同等功耗下性能领先最多67%,同等行下功耗低最多62%!对比锐龙9 7040系列中的Radeon 780M更是性能、能效都遥遥领先。在流行的3A游戏中,官方列出了9款,都基本持平或者优于Intel锐炫核显,优势项目包括《地平线:零之曙光》、《火箭联盟》等。 ... PC版: 手机版:

封面图片

高通骁龙 X Elite 处理器被指游戏性能不佳,兼容性问题严重

高通骁龙 X Elite 处理器被指游戏性能不佳,兼容性问题严重 作为参考,官方的“Windows on Arm 认证游戏”列表仅有 1259 款,其中许多都是要求不高的独立游戏和 2D 游戏。而使用 Linux 兼容工具 Valve Proton 的 Steam Deck,其通过验证的“可玩游戏”数量在去年 10 月份就已突破 12100 款,到目前为止已经增加到了 15391 款。

封面图片

ROCm补丁确认AMD Navi 48 "RDNA 4" GPU 今年将用于RX 8000

ROCm补丁确认AMD Navi 48 "RDNA 4" GPU 今年将用于RX 8000 ROCm GitHub 上关于即将推出的 AMD RDNA 4 GPU SKU 的内容不多,但根据最新传言,Navi 48 GPU 预计将是两款芯片中速度最快的一款,并将瞄准更高端的产品。也就是说,Navi 48 并不像 Navi 31(RDNA 3)或 Navi 21(RDNA 2)系列那样是典型的高端 SKU,因为据说这些芯片已被淘汰,转而采用更主流的芯片来面向大众市场。因此,AMD Navi 48 GPU 目前预计将达到 Navi 31 的性能水平,同时成为游戏玩家的强力性能/价格选择。目前,AMD Radeon RX 7900 GRE 是 RDNA 3 的入门级产品,新定价更新后售价约为 549 美元。如果 AMD 能在 400 至 500 美元左右的价位上提供比 7900 GRE 更好的性能,那么对于游戏玩家来说这将是非常划算的产品。值得注意的一点是,AMD 的 RDNA 4 GPU 架构将是一种全新的设计,因此我们还应该考虑到这样一个事实,即AMD可以在光线追踪游戏中对其性能进行微调,还可以为玩家带来额外的收益,例如注入AI技术的FSR插帧技术现在可与英伟达的 DLSS 相媲美,尽管 FSR 3 目前的状态对于游戏玩家来说已经是一个非常好的替代品,但AI 加速可以继续弥补 FSR 的一些不足,特别是目前与 DLSS相比急需的更高的图像质量。尽管目前有关 RDNA 4 GPU 的细节还很有限,但我们可以预计,下一代产品线将支持GDDR7 内存,最初将采用 28/32 Gbps 芯片和 16Gb 内存(每个模块 2 GB VRAM)。不过,AMD 也可以选择更具成本效益的方式,目前只使用速度更快的 GDDR6 芯片。据传,这些芯片将采用更小的单片式设计,这意味着 MCD 设计将在推出一年后被放弃。 ... PC版: 手机版:

封面图片

SCALE 让 CUDA 应用无需修改运行在 AMD GPU 上

SCALE 让 CUDA 应用无需修改运行在 AMD GPU 上 英伟达通过其私有工具 CUDA 建立了护城河,成为 AI 热的最大赢家,大部分 AI 应用都是基于 CUDA 直接运行在英伟达的硬件上。英国公司 Spectral Compute Ltd 开发了一个 GPGPU 工具包 SCALE,允许 CUDA 应用无需修改就能编译运行在 AMD GPU 上,类似性能的 AMD GPU 通常比英伟达 GPU 更便宜。SCALE 目前支持 RDNA 2.0 和 RDNA 3.0 系列显卡,对旧一代的显卡如 Vega 10 和 GCN 5.0 的支持还在开发之后。 via Solidot

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人