高通自研 Oryon SoC 曝光：性能优于苹果 M2、功耗上存在诸多挑战 ========超级火龙？

同性能比 M2 降低一半功耗比 PC 只用了 1/4 功耗（没提没放图（少见

高通公布骁龙X GPU架构细节：性能超67％、功耗低62％

高通公布骁龙X GPU架构细节：性能超67％、功耗低62％ Adreno X1是专门针对Windows PC设计的，图形接口完整支持DirectX 12.1(Shader Model 6.7/DirectML)、DirectX 11、Vulkan 1.3、OpenCL 3.0，都有原生驱动支持。FP32单精度浮点性能最高4.6TFlops(每秒4.6万亿次计算)，像素填充率最高72Gp/s(每秒720亿次)。如此详细的架构图对于高通GPU来说似乎还是第一次，可以看到分为6个着色处理器(SP)，整体共计1536个FP32 ALU，可以通俗地表达为1536个核心，最高频率1.5GHz。粗暴地按照核心数计算，这相当于GTX 1660 Ti，或者说三个Arc A770，或者说四分之三个RX 7600。渲染前端模块支持每时钟周期2个三角形和光栅化处理、双向LRZ(地分辨率深度测试)、基于图像的可变着色率(VSR Tie2)。还有专门用于分箱(binning)的前端模块，与渲染同步运行。6个SP对应6个渲染后端，每时钟周期最多48个像素、96个fragment(用于MSAA抗锯齿)。另外还有GMU，也就是GPU管理单元，完整支持虚拟化(最多8个虚拟机)，还有电源管理的作用。细看SP部分，也就是SIMD着色处理器，属于核心执行模块，分为两个uSPTP(微型着色与纹理流水线)。整个SP，分布着256个FP32 ALU(单精度浮点算术逻辑单元)，支持FP32/16、INT32/16、BF16数据类型，支持DP4ACC指令(四路INT8点积)，以及512个FP16 ALU(半精度浮点算术逻辑单元)，支持FP16、INT16、BF16数据类型。此外，还有32个32位EFU(基本功能单元)、384KB GPR(通用寄存器)、指令缓存、本地缓冲、载入/存储单元、纹理流水线和纹理缓存、GMEM单元，等等。GPU内还集成了384KB集群缓存(每两个SP共享128KB)、1MB一体化二级缓存、6MB系统级缓存(即三级缓存)，还有一些其他较小的缓存，用于着色器指令、本地纹理数据等。GMEM是个特殊功能单元，也就是高带宽的本地GPU显存，容量3MB，带宽达2TB/s，与系统内存完全异步。而且，它不仅仅是缓存，还可以全部或部分灵活地用于色彩与景深缓存、通用本地内存，无论是图形渲染还是通用计算都可以使用。它可以让GPU大大减少对系统内存的依赖，降低对延迟和带宽的需求，还有着超高的性能与能效。FlexRender弹性渲染技术也值得一提，可以由驱动控制，针对每一个不同的表面动态切换不同的渲染模式，提升性能的同时尽可能降低功耗。具体分为三种模式：一是Direct Mode，PC标准渲染方式，兼容性最好。二是Binned Mode，将每一帧画面切分为不同的区块(Tile)，每一个都都会进入GMEM，可尽可能减少数据移动，提高能效。三是Bined Direct Mode，前述两种方式的混合。软件方面，高通承诺每月升级GPU驱动，Adreno控制面板可调节性能和各项功能，而在兼容性方面已经是数百款流行的Windows应用，已测试的游戏均可查询，还有丰富的开发工具。高通声称，Adreno X1对比酷睿Ultra的锐炫核显，同等功耗下性能领先最多67％，同等行下功耗低最多62％！对比锐龙9 7040系列中的Radeon 780M更是性能、能效都遥遥领先。在流行的3A游戏中，官方列出了9款，都基本持平或者优于Intel锐炫核显，优势项目包括《地平线：零之曙光》、《火箭联盟》等。 ... PC版：手机版：

研究发现 AI 模型存在性别偏见：中性 / 男性 LLM 性能优于女性角色========(指向那只AI猫娘)那她的性能呢？

传华为下一代麒麟旗舰SoC性能优于骁龙8 Gen2 流畅度媲美Gen3

传华为下一代麒麟旗舰SoC性能优于骁龙8 Gen2 流畅度媲美Gen3 不过，即将推出的麒麟版本可能会带来长期以来最显著的性能飞跃，有传言称它的速度将超过骁龙 8 Gen 2。此外，采用该芯片的设备（Mate 70 家族的任何成员）的界面流畅度将与采用骁龙 8 Gen 3 的手机相似。预计华为将于今年晚些时候推出麒麟 9100，据传将在中芯国际的 5nm 节点上量产。此前，我们曾报道过中国最大的半导体制造商已成功开发出新工艺，使用的是 DUV 机器，而不是"最先进的"EUV 硬件。虽然这项技术的开发堪称奇迹，但使用非紫外光设备所带来的高成本和低产量显然是需要关注的问题，但无论如何，这一突破应能让华为缩小性能差距。据 X 上的 @jasonwill101 称，即将发布的麒麟 SoC 的"整体"性能将优于骁龙 8 Gen 2。此外，他还声称，虽然这款芯片组的规格可能无法与骁龙 8 Gen 3 相提并论，但"实际体验"会有所改善。传言的意思可能是，界面流畅度将与其他骁龙 8 Gen 3 旗舰相媲美，但华为如何做到这一点呢？软件在其中扮演着不可或缺的角色。据说华为将在今年晚些时候正式推出 HarmonyOS NEXT，彻底摆脱Google的 Android 平台。运行 HarmonyOS NEXT 的最大好处是，据说它的内存利用效率是 Android 的三倍，这意味着它在资源消耗方面将更加轻量级。仅这一优势就意味着，运行上一代麒麟芯片的华为老款智能手机可以很好地处理用户界面，流畅地运行各种任务。由于采用 5nm 工艺量产，新的麒麟 SoC 还将拥有更高的能效，但我们还没有看到实际的性能泄露。由于目前缺乏证据，我们无法对华为未来发布的产品发表评论，但不得不说，我们对接下来的产品充满期待。 ... PC版：手机版：

传ARM Cortex-X5架构性能不佳存在功耗高、多核得分低的问题

传ARM Cortex-X5架构性能不佳存在功耗高、多核得分低的问题联发科技的 Dimensity 9400 等芯片组将受到最大影响，是因为因为它将放弃能效内核，转而使用 Cortex-X5 来提升原始性能。在之前的传言中，Dimensity 9400 的 CPU 集群被传包括 Cortex-X5，其中三个 Cortex-X4，将以近万分的多核成绩挑战骁龙 8 Gen 4。然而，虽然这些结果给我们留下了深刻印象，但如果不先了解功耗情况，我们就无法提供公正的概述。据 Revegnus on X 报道，来自中国的传言称，Cortex-X5 在性能和效率方面都表现不佳。据说，提高时钟速度会使 Cortex-X5 的功耗升至顶峰，而降低这些频率则会对整体多核性能产生不利影响，这意味着 ARM 和联发科需要进一步合作，对 Cortex-X5 进行调整，以实现理想的能效平衡。从这一传言来看，苹果的 A18 Pro 似乎更有前景，因为尽管它的跑分低于骁龙 8 Gen 4 和 Dimensity 9400，但苹果公司可能会优先考虑"每瓦性能"，同时放弃一些性能以实现足够的电池续航时间。由于这只是另一则传言，希望读者谨慎对待，毕竟，Dimensity 9400 据说是在台积电第二代 3nm 工艺上量产的，因此效率的提高可能足以抵消 Cortex-X5 目前可能出现的功率激增。 ... PC版：手机版：

总结：高通发布了单核性能超越 M2 Max 和 i9-13980HX，同性能对比 M2 Max 节能 30%，对比 i9 节能

总结：高通发布了单核性能超越 M2 Max 和 i9-13980HX，同性能对比 M2 Max 节能 30%，对比 i9 节能 70% 的 Oryon 架构。 4nm 打造的 12 核 X Elite 平台，多核性能超越 13800H，并且能耗有 60% 的优势。 GPU 性能大约是 1.8x Radeon 780M，在实现 780M 性能时功耗 -80%。 NPU 同样强大，助力百亿大模型落地。发布了骁龙 8G3，小米 14 首发。 CPU +30%，GPU +25%，NPU 性能翻倍，助力百亿参数大模型落地。发布了骁龙 seamless 无缝流转技术。发布了利用微 WiFi（micro WiFi）和蓝牙智能切换的 XPAN 音频技术和 S7 音频芯片。