谷歌发布 WebGPU！90 多位贡献者研发 6 年

谷歌发布 WebGPU！90 多位贡献者研发 6 年经过六年的开发，谷歌 Chrome 团队正式发布 WebGPU，用于在网络上进行高性能 3D 图形与数据并行计算。WebGPU 现已在 Chrome 113 Beta 中默认启用。 WebGPU 是一种新型 Web 图形 API，浏览器可以借助 webGPU 直接允许网页访问电脑的显卡，具有显著减少同等图形规模下 JavaScript 工作量、将机器学习模型的推理效率提升 3 倍以上等优势。之所以能实现这样的飞跃，要归功于其令 WebGL 无法实现的灵活 GPU 编程和高级功能访问能力。 WebGPU VSWebGL 性能对比题图这个场景中有 1000 棵树，它们不是使用实例化绘制的，而是每一棵树都有一个 draw call，所以一个场景要有 1000 多个 draw call。如果使用 WebGL 进行绘制的话，可以看到，使用 2070 显卡只能跑到 21FPS，而且每一帧的 CPU 时间需要 44 毫秒，但是同样用 WebGPU 来处理，可以跑到 123 帧，每一帧的 CPU 时间只有 0.1 毫秒，这个是 WebGPU 和 WebGL 最大最显著的性能上的差距。来源，来自：雷锋频道：@kejiqu 群组：@kejiquchat 投稿：@kejiqubot

在Telegram中查看

相关推荐

谷歌正式发布WebGPU：90多位贡献者研发6年，浏览器终于可以利用底层硬件了 #抽屉IT

Linux 6.9 预计周日发布针对英特尔和AMD处理器都有重大改进

Linux 6.9 预计周日发布针对英特尔和AMD处理器都有重大改进对于英特尔（Intel）和 AMD（AMD）来说，最近和即将推出的平台的改动仍然相当大。Linux 6.9 中英特尔/AMD 的一些重大变化包括：- 针对现代 Ryzen 系统的 AMD P-State 首选内核处理。这是为了利用 CPU 内核之间的 ACPI CPPC 数据，改善 AMD Ryzen 系统上可实现更高频率的内核的任务分配，同时帮助在 Zen 4 和 Zen 4C 内核之间进行混合选择。这种 AMD 首选内核支持从去年开始开发。- 针对英特尔酷睿"流星湖"调整，可以在 Linux 6.9 上为那些使用新款英特尔笔记本电脑的用户带来不错的性能提升。- Linux 6.9 还显示了 AMD 第四代 EPYC 在 Linux 6.9 上的一些性能提升，以及英特尔至强 Max 在新内核上的一些人工智能工作负载的性能提升。- 英特尔 FRED 与未来的英特尔 CPU 合并，用于灵活返回和事件交付，以彻底改变 CPU 环路转换。- 合并了 AMD FRU 内存毒药管理器和其他工作，以更好地支持 AMD MI300 系列。- 重写了 x86 拓扑代码，以更好地处理英特尔酷睿混合 CPU。- 现在所有支持的显卡均已启用 Intel Fastboot 支持。- 支持在现代 4K+ 显示器上支持更大的帧缓存控制台字体。- AMD 继续向 AMDGPU 驱动程序上游提供更多 RDNA3+ 刷新和 RDNA4 图形硬件支持。- 继续开发实验性的英特尔 Xe DRM 内核图形驱动程序，英特尔的目标是为 Xe2 / Lunar Lake 做好准备。 ... PC版：手机版：

内部人士称最新泄露的PS5 Pro规格属实索尼仍将发布日锁定在2024年假期

内部人士称最新泄露的PS5 Pro规格属实索尼仍将发布日锁定在2024年假期更大的 GPU 和更快的内存，使光栅化渲染性能提高了 45%；大规模改进的光线追踪架构，速度应是普通 PS5 的 2-3 倍，峰值可达 4 倍；定制机器学习架构，支持 8 位 300 TOPS（每秒万亿次运算）；建立 ML 架构是为了实现所谓的 PlayStation 光谱超分辨率（PSSR）升级技术。泄露的文件将其描述为索尼基于 PlayStation 机器学习（PSML）算法的多帧超分辨率版本。根据泄露的信息，PSSR 目前最高支持 4K，但计划增加 8K 支持；PSSR 是时域抗锯齿升频（TAAU）的 ML 增强版本，所需的输入与英伟达 DLSS 或 AMD FSR 相似，并完全支持高动态范围（HDR）管线。此外，与最新版本的 DLSS 一样，PSS 也不需要按游戏进行训练。该文件还称，PSSR 仅需占用 PS5 Pro 的 250MB 内存，目前从全高清升至 4K 的渲染成本为 2 毫秒，但优化工作仍在进行中；该文件还包括与 TAAU 和 AMD FSR 2 的图像对比，据称显示 PSSR 的图像质量更优。从这些 PS5 Pro 信息中可以看出，虽然 AMD 最近透露将在今年发布自己的基于人工智能的升频技术，但索尼似乎决定在这一领域做自己的事情。亨德森在报告中说，PS5 Pro 开发包早在 2023 年 9 月就与第一方 PlayStation 工作室共享了，而第三方开发者则是在 2024 年 1 月拿到的。今年春季，索尼将发布与最终硬件完全相同的开发包。不过，玩家何时才能买到这款游戏机呢？据说索尼仍将 2024 年的假日作为发售窗口，但由于今年的日历上没有任何第一方游戏，这一目标可能会改变。不过，即使推迟发售，索尼也希望 PS5 Pro 能在2025 年《GTA VI》发售时上市。 ... PC版：手机版：

AMD官宣年更芯片：新款MI325X重磅发布比H200快1.3倍

AMD官宣年更芯片：新款MI325X重磅发布比H200快1.3倍芯片年更，与领头羊英伟达一较高下自去年以来，英伟达向投资者明确表示，计划将发布周期缩短为每年一次，现在AMD也紧随其后，开始芯片年更。首席执行官苏姿丰（Lisa Su）表示“每年都有这样的节奏，是因为市场需要更新的产品和能力...... 我们每年都会有下一个大事件，这样我们就始终拥有最具竞争力的产品组合。”她详细介绍了该公司未来两年开发人工智能芯片的计划，以挑战行业领导者英伟达。最新的MI325X加速器将于2024年第四季度上市。即将推出的名为MI350的芯片系列，预计将于2025年上市，并将基于新的芯片架构。与现有的MI300系列人工智能芯片相比，MI350在推理方面的性能预计将提高35倍。2026年，MI400系列将会被推出，该系列将基于名为“Next”的架构。如此这般，AMD和英伟达“你方唱罢我登场”，两者之间的较量充满了刀光剑影。开发生成式人工智能程序的竞赛催生了人工智能数据中心的发展，而支撑数据中心的就是这些先进芯片。AMD一直是英伟达的竞争者，后者目前主导着利润丰厚的人工智能半导体市场，占据了约80%的份额。现在，为了追赶英伟达，AMD更加孤注一掷，“人工智能显然是我们公司的头等大事，我们确实利用了公司内部所有的开发能力来实现这一点。”先不管芯片表现如何，AMD此举也是为了吸引投资者的关注。在华尔街“铲子”交易中投入了数十亿美元的投资者一直在寻求芯片公司的长期更新，因为他们要评估生成式AI蓬勃发展的持久性，而这一趋势迄今为止还没有放缓的迹象。自2023年初以来，AMD股价已上涨一倍多。与同期英伟达股价七倍多的涨幅相比，这一涨幅仍然相形见绌。苏姿丰在4月份表示，AMD预计2024年AI芯片销售额约为40亿美元，比之前的估计增加了5亿美元。在Computex活动上，AMD还表示其最新一代中央处理器单元（CPU）可能会在2024年下半年上市。虽然企业一般会优先考虑在数据中心中使用人工智能芯片，但AMD的部分CPU也会与GPU结合使用，不过两者的比例更倾向于GPU。AMD详细介绍了其新型神经处理单元（NPU）的架构，专门用于处理AI PC中的设备端AI任务。随着个人电脑市场走出长达数年的低谷，芯片制造商们一直寄希望于人工智能功能的增强来推动个人电脑市场的增长。惠普和联想等个人电脑供应商将发布包含AMD AI PC芯片的设备。AMD还放出话来，他们的处理器已经超过了微软对Copilot+PC的硬件要求。3nm EPYC Turin，AI负载超越英特尔苏姿丰在Computex 2024的主题演讲中宣布，备受期待的第五代EPYC Turin处理器，具有192个核心和384个线程，在人工智能工作中比英特尔Xeon快5.4倍，将于2024年下半年推出。这个3nm芯片标志着AMD Zen 5架构首次应用于数据中心芯片，AMD声称它们在关键AI工作负载上的性能比英特尔当前一代的Xeon芯片快5.4倍。Turin据说有两个版本：一个使用标准的Zen 5核心，另一个使用一种称为Zen 5c的密度优化核心。苏姿丰还宣布，AMD现在已经占据了数据中心市场的33%。新的Zen 5c芯片将配备多达192个核心和384个线程，采用3nm工艺节点制造，然后与塞入单个插槽的6nm I/O Die（IOD）配对。整个芯片由17个小单元组成。最高核心数型号采用AMD的Zen 5c架构，该架构使用密度优化的核心，概念上类似于英特尔的e-cores。不过，AMD率先在数据中心的x86芯片中使用这种核心类型。配备标准全性能Zen 5核心的型号配备12 个采用N4P工艺节点的计算芯片和一个中央6纳米IOD芯片，总共13个小芯片。AMD声称，在LLM（聊天机器人）中，AMD的优势是Xeon的5.4倍，在翻译模型中是Xeon的2.5倍，在摘要工作中是Xeon的3.9倍。AMD还展示了其128核Turin模型在科学NAMD工作负载中的3.1倍优势，并现场演示了Turin每秒生成的token数量比Xeon多4倍。192核Zen 5c芯片是AMD EPYC Bergamo的后续系列，后者是业界首款具有密度优化核心的x86数据中心处理器（Zen 4c）。Bergamo的最高核心为128个。采用Zen 5架构的标准Turin型号可扩展到128个核心，每个核心面积减半但功能不变，与当前一代EPYC Genoa（最高96个核心）相比，实现了强劲的代际提升。Zen 5c Turin芯片将与英特尔的144核Sierra Forest芯片和Ampre的192核 AmpereOne处理器展开竞争，前者标志着英特尔在其Xeon数据中心阵容中首次采用效率核心（E-cores），后者则标志着Google和微软正在开发或采用定制芯片。与此同时，标准的Zen 5 EPYC处理器将迎战英特尔即将推出的Xeon 6系列。AMD还分享了一些基准测试，以突出它相对于英特尔竞争型号的优势。随着Turin 芯片越来越接近市场，我们可以期待更多的细节。Ryzen AI 300系列“Strix Point”处理器AMD揭开Ryzen AI 300系列“Strix Point”处理器的神秘面纱50 TOPS的AI性能，Zen 5c密度核心首次应用于Ryzen 9。Strix Point APU配备了XDNA 2 AI加速器，AMD表示该加速器能够实现高达50 TOPS的性能，领先于最近微软使用的高通骁龙X Elite（45 TOPS）。作为一款具有强大集成显卡的APU，游戏也是测试的一部分。AMD希望通过其集成Radeon 880M和890M GPU来确保游戏领域的领先地位。根据AMD的演示，Ryzen AI 300系列芯片平均性能比英特尔Core Ultra 185H快36%。这里的平均分数取自六款主要游戏的基准测试，包括《赛博朋克 2077》、《无主之地 3》、《F1 23》、《刺客信条幻影》、《古墓丽影：暗影》和《孤岛惊魂 6》。代号为Strix Point的全新Ryzen AI 300系列芯片，采用全新的Zen 5 CPU微架构，拥有两种核心、升级的RDNA 3.5图形引擎，当然还有AMD全新的XDNA 2引擎，可在本地运行AI工作负载。AMD的新品牌方案现在将AI直接带入了芯片名称中，这反映了公司对以AI为重点的全新XDNA 2神经处理单元（NPU）的强烈关注。XDNA 2现在可提供50 TOPS的性能，是AMD第三代AI处理器性能的5倍。这一性能水平超越了Windows PC的所有其他芯片，包括高通公司前景看好的骁龙X Elite，并轻松超过了微软对下一代AI PC的40TOPS要求，这是在本地运行Copilot的最低硬件要求。AMD在其他方面也取得了很多进步，针对轻薄型和超轻型笔记本电脑的Zen 5处理器已升级到12核，过去只能使用8个CPU核心，而新的RDNA 3.5集成图形引擎最多可使用16个计算单元，比上一代的最多12个有所增加。旗舰级Ryzen AI 9 HX 370配备了12个核心和24个线程，基本频率为2.0 GHz，峰值频率为5.1GHz。不过，从品牌宣传幻灯片中可以看到，该芯片与GPU和NPU核心一起，在单片芯片上配备了4个标准Zen 5核心和8个密度优化的Zen 5C核心。这标志着更小的Zen 4c核心首次出现在最高级别的Ryzen 9移动系列中，因为这些核心以前仅限于AMD采用上一代鹰点芯片的最低端Ryzen 5和3型号。与标准的Zen 5性能核心相比，AMD的Zen 5c核心旨在减少处理器芯片上的空间占用，同时为要求不高的任务提供足够的性能，从而节省电能，并在每平方毫米上提供比以前更多的计算能力。虽然这种技术在概念上与英特尔的E-cores类似，但AMD的Zen 5c采用了与标准Zen 5核心相同的微架构，并通过较小的核心支持相同的功能，而英特尔的设计则采用了不同的架构和功能支持。不过，较小的Zen 5c核心工作时钟频率较低，因此峰值性能不如标准核心，但它们也为其他附加功能（如更大的GPU和NPU）保留了芯片面积。HX 370芯片还拥有36 MB三级缓存、50 TOPS XDNA 2 NPU和新的RDNA 3.5 Radeon 890M图形引擎。该芯片的额定TDP为 28W，但其宽泛的cTDP范围意味着这并不能反映其实际运行功耗水平。Ryzen AI 9 365配备10个核心，包括4个标准Zen 5核心和6个经过密度优化的Zen 5c核心，基本频率为2.0GHz，峰值频率为5.0 GHz。该芯片还配备了50 TOPS NPU和一个12-CU RDNA 3.5 Radeon 88... PC版：手机版：

高通公布骁龙X GPU架构细节：性能超67％、功耗低62％

高通公布骁龙X GPU架构细节：性能超67％、功耗低62％ Adreno X1是专门针对Windows PC设计的，图形接口完整支持DirectX 12.1(Shader Model 6.7/DirectML)、DirectX 11、Vulkan 1.3、OpenCL 3.0，都有原生驱动支持。FP32单精度浮点性能最高4.6TFlops(每秒4.6万亿次计算)，像素填充率最高72Gp/s(每秒720亿次)。如此详细的架构图对于高通GPU来说似乎还是第一次，可以看到分为6个着色处理器(SP)，整体共计1536个FP32 ALU，可以通俗地表达为1536个核心，最高频率1.5GHz。粗暴地按照核心数计算，这相当于GTX 1660 Ti，或者说三个Arc A770，或者说四分之三个RX 7600。渲染前端模块支持每时钟周期2个三角形和光栅化处理、双向LRZ(地分辨率深度测试)、基于图像的可变着色率(VSR Tie2)。还有专门用于分箱(binning)的前端模块，与渲染同步运行。6个SP对应6个渲染后端，每时钟周期最多48个像素、96个fragment(用于MSAA抗锯齿)。另外还有GMU，也就是GPU管理单元，完整支持虚拟化(最多8个虚拟机)，还有电源管理的作用。细看SP部分，也就是SIMD着色处理器，属于核心执行模块，分为两个uSPTP(微型着色与纹理流水线)。整个SP，分布着256个FP32 ALU(单精度浮点算术逻辑单元)，支持FP32/16、INT32/16、BF16数据类型，支持DP4ACC指令(四路INT8点积)，以及512个FP16 ALU(半精度浮点算术逻辑单元)，支持FP16、INT16、BF16数据类型。此外，还有32个32位EFU(基本功能单元)、384KB GPR(通用寄存器)、指令缓存、本地缓冲、载入/存储单元、纹理流水线和纹理缓存、GMEM单元，等等。GPU内还集成了384KB集群缓存(每两个SP共享128KB)、1MB一体化二级缓存、6MB系统级缓存(即三级缓存)，还有一些其他较小的缓存，用于着色器指令、本地纹理数据等。GMEM是个特殊功能单元，也就是高带宽的本地GPU显存，容量3MB，带宽达2TB/s，与系统内存完全异步。而且，它不仅仅是缓存，还可以全部或部分灵活地用于色彩与景深缓存、通用本地内存，无论是图形渲染还是通用计算都可以使用。它可以让GPU大大减少对系统内存的依赖，降低对延迟和带宽的需求，还有着超高的性能与能效。FlexRender弹性渲染技术也值得一提，可以由驱动控制，针对每一个不同的表面动态切换不同的渲染模式，提升性能的同时尽可能降低功耗。具体分为三种模式：一是Direct Mode，PC标准渲染方式，兼容性最好。二是Binned Mode，将每一帧画面切分为不同的区块(Tile)，每一个都都会进入GMEM，可尽可能减少数据移动，提高能效。三是Bined Direct Mode，前述两种方式的混合。软件方面，高通承诺每月升级GPU驱动，Adreno控制面板可调节性能和各项功能，而在兼容性方面已经是数百款流行的Windows应用，已测试的游戏均可查询，还有丰富的开发工具。高通声称，Adreno X1对比酷睿Ultra的锐炫核显，同等功耗下性能领先最多67％，同等行下功耗低最多62％！对比锐龙9 7040系列中的Radeon 780M更是性能、能效都遥遥领先。在流行的3A游戏中，官方列出了9款，都基本持平或者优于Intel锐炫核显，优势项目包括《地平线：零之曙光》、《火箭联盟》等。 ... PC版：手机版：

英特尔Xe2 GPU正式发布：性能提升 50% 包含全新光线追踪内核

英特尔Xe2 GPU正式发布：性能提升 50% 包含全新光线追踪内核英特尔 Xe2 正式发布，并将应用于 Lunar Lake CPU 和代号为"Battlemage"的下一代 Arc 独立显卡阵容。英特尔 Xe2 的部分目标是提高利用率、改善工作分配和减少软件开销。Xe2 是一项从头开始的设计，修复了 Xe"Alchemist"GPU 存在的几个主要问题。一开始，英特尔就用一张 IP 性能效率图向观众展示了高达 12.5 倍的显著收益，让人惊叹不已。我们将深入介绍 Xe2 是什么，以及英特尔是如何实现这些收益的。英特尔表示，Xe2 架构与 Xe 架构一样，具有高度的可扩展性，这将促使其集成到 Lunar Lake 等低功耗移动 SoC 中，并集成到稍后推出的具有独立选项的高端 Arc 显卡中。第二代 Xe 内核或 Xe2 配备了多种计算资源，这些资源被重新划分为本地 SIMD16 引擎，以提高效率。Xe2 核心功能8 个 512 位矢量引擎8 个 2048 位 XMX 引擎支持 64b 原子运算192KB 共享 L1$/SLM矢量引擎也已更新，其中包括：SIMD16 本地 ALU -支持 SIMD16 和 SIMD32 操作Xe 矩阵扩展（支持 INT2、INT4、INT8、FP16、BF16）扩展数学和 FP64 -常数：正弦、余弦、对数、指数3 向共同发行 -FP + INT/EM + XMXAlchemist"Xe"GPU 上也有 Xe 矩阵引擎或 XMX 单元，但现在的变化是，它们支持更多数据类型，运行速度更快，FP16 额定频率为 2048 OPS/时钟，INT8 额定频率为 4096 OPS/时钟。让我们来看看这些新引擎是如何在 Xe2 渲染片段（Xe2 GPU 的基本模块）中堆叠的。这些渲染片可根据需要进行堆叠和扩展，并经过优化，以减少延迟、消除停滞并改善硬件/软件握手。这些渲染片连接到命令前端，该命令前端本机支持间接执行。渲染片还包括一个新的几何引擎，具有 3 倍的顶点获取吞吐量和 3 倍的网格着色性能（具有顶点重用功能）；新的 L1$/SLM 缓存，用于顺序外采样（具有压缩纹理）；2 倍的无过滤采样吞吐量和可编程偏移；一个新的 HiZ 单元，缓存增加了 50%，并支持对小型基元进行早期 HiZ 剔除。最后，还有两个新的像素后端（Pixel Backends），可提供两倍的混合吞吐量，像素颜色缓存增加了 33%，并可将目标预取渲染至 L2$。Xe2 的最新光线跟踪单元在 Xe1 的基础上进行了改进。Xe2 内核的一个主要部分是 RTU（光线跟踪单元），它具有 3 条遍历管道、18 个方框交叉点（每个方框交叉点 6 个，每个 RTU 3 个方框）和 2 个三角形交叉点。以上就是英特尔 Xe2 GPU 架构的基本概述：第 2 代 Xe2 内核增强型矢量引擎深度缓存新型 XMX 发动机性能和效率 - 优化前端本机硬件支持 exectue 间接命令更大的光线跟踪装置总体而言，英特尔的 Xe2 GPU 架构旨在与游戏更加兼容，并实现更高的利用率。新的执行间接块被游戏用来加速绘制调用，由于它被虚幻引擎等引擎大量使用，因此获得 12.5 倍的提升对游戏玩家来说是个好兆头。第一款采用 Xe2 GPU 的产品是集成配置的 Lunar Lake。Lunar Lake 中的多个区块都与 GPU 有关，如媒体引擎和显示引擎。在谈这些之前，我们先来谈谈 Lunar Lake 的 Xe2 配置：8 个 Xe2 内核64 个矢量引擎2 几何管道8 个采样器4 个像素后端8 个光线追踪单元8 MB L2$Lunar Lake Xe2 GPU 有 8 个 Xe2 内核，每个 Xe2 内核有 8 个 XMX 和 8 个矢量单元、一个负载/存储单元、一个线程排序单元和一个专用的 L1/L$ 缓存。这 4 个 Xe2 内核中的每一个都能生成一个渲染片。那么，与 Meteor Lake 的 Xe GPU 相比，这一切的性能表现如何呢？英特尔表示，Xe2 GPU 在 ISO 下的性能提高了 50%，在性能不变的情况下，功耗大幅降低。XMX 块也是一个重要部分，它涌入了 67 个峰值 INT8 TOPS，为 Lunar Lake CPU 的整体 AI 能力锦上添花。该芯片总共提供 120 个平台 TOPS，其中 48 个 TOPS 来自 NPU4，5 个 TOPS 来自 CPU 本身。月球湖的 Xe 显示引擎现在，我们从 GPU 转向 Lunar Lake CPU 本身的其他模块，首先是显示引擎。显示引擎配备 3 个显示管道，最高支持 8K60 HDR，最高支持 3x 4K60 HDR，最高支持 1080p360 或 1440p360。显示引擎支持 HDMI 2.1、DisplayPort 2.1 和新的 eDP 1.5 功能。显示引擎的前端包括解码/解密和流缓冲区。在像素处理流水线方面，每个流水线有 6 个平面，支持色彩转换和合成的硬件，同时具有灵活性和高能效。此外，还有一个额外的低功耗优化流水线，带有面板重放功能（空闲帧期间的功率门控）和一个带有 LACE（本地自适应对比度增强）功能的全新亮度传感器。在压缩和编码方面，显示流压缩引擎支持 31 种视觉无损压缩和传输编码（HDMI 和 DisplayPort 协议的流编码）。路由器和端口包括流组装和端口路由，最多支持 4 个端口，增加了灵活性。回到带有面板重放功能的 eDP（eDisplayPort）1.5，它被称为面板自刷新的进化版，具有早期传输和自适应同步支持的选择性更新。新的显示功能可减少抖动，改善播放效果，同时提供更高的能效。用于 Lunar Lake 的 Xe 媒体引擎支持 VVC、侧缓存和更好的编码Lunar Lake SOC 与 Xe2 GPU 连接的最后一个区块是媒体引擎，它现在拥有自己专用的 8 MB 共享侧缓存。芯片的其他部分可以使用这个新缓存，但没有必要，因为其他内核本身就有专用缓存。这种侧缓存可为 Lunar Lake 节省大量带宽，因为跨媒体工作负载的系统内存流量减少了。这也大大降低了编码工作负载的功耗。媒体引擎支持最高达 8k60 10 位 HDR 解码、高达 8k60 10 位 HDR 编码、AVC、VP9、H.265 HEVC、AV1 和全新的 VVC 引擎。VVC 引擎大大降低了比特率，同时提供与 AV1 相同的质量（文件大小最多减少 10%）。它还支持自适应分辨率流和屏幕内容编码。最后，我们的 Windows GPU 软件栈已经为 Xe2 GPU 做好了准备。英特尔表示，它花了大量时间调整 Alchemist"Xe"GPU 的 API 级性能，尤其是 DX9，但所有这些软件工作都将转移到 Xe2，并支持所有最新的 API 和框架及其运行时。Xe2 是一种全新的图形架构，它为 Lunar Lake 等集成解决方案和即将推出的 Arc Battlemage 系列的独立选项带来了巨大的性能提升和最新的功能集。公司将在今年晚些时候分享更多有关 Battlemage 独立产品的信息。 ... PC版：手机版：

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人