Arm发布Corte-X4/A720/520 CPU架构：淘汰32位、首次14核功耗大降40%

Arm发布Corte-X4/A720/520CPU架构：淘汰32位、首次14核功耗大降40%除了X4、A720等CPU架构之外，Arm这次也升级了DynamIQ管理内核DSU-120，可以更好地提升CPU并行性，最高做到了14核CPU，显然是准备给ArmPC笔记本的。同时它还从之前的1+3+4架构变成了1+5+2架构，给A720这样的大核留出了更多空间，这样的暗示简直不能太明显了，毕竟年底的骁龙8G3早就传闻要上1+5+2了。这次新架构的另一个重大变化就是新架构只有AArch64位，AArch32已经被放弃了，意味着此后的Arm将转向纯64位架构，这一天也期盼已久的。来看下性能/能效的变化，X4超大核心提升了15%的性能或者40%的功耗降低，A720大核也有20%的能效提升，A520小核的能效提升了22%。作为单核性能的主力，X4超大核是Arm架构中能效最好的，同时还提升了并行性，L2缓存可提升到每核2MB。大核A720升级到了Armv9.2指令集，同样的功耗下性能比上代的A715更强，架构优化了内存读取，带来了大幅功耗降低，同样的面积下性能比A78还要高。A520小核这次最大的变化主要是放弃32位，转向纯64位，主打低功耗，而且面积减少22%的情况下性能还能提升8%。整个X4/A720/A520家族的特点就是性能提升同时能效更高，X4超大核能降低40%功耗让人狠期待，其他核心及DSU也有20%左右的能耗改善。一句话来说，今年底的骁龙8G3及天玑9300系列非常值得期待了。...PC版：https://www.cnbeta.com.tw/articles/soft/1362217.htm手机版：https://m.cnbeta.com.tw/view/1362217.htm

在Telegram中查看

相关推荐

Arm 发布 Cortex X4、A720 和 A520 内核，全面抛弃 32 位。

Arm发布CortexX4、A720和A520内核，全面抛弃32位。Arm公司今天发布了2023年的移动处理器核心设计：Cortex-X4、A720和A520，这些核心都是基于Armv9.2架构，只支持64位指令集，不再兼容32位应用。Arm公司表示，这些核心在性能和效率方面都有显著的提升，同时也加强了安全性和可扩展性。——Arm

Arm发布G720 GPU：第五代GPU架构节省40%带宽

Arm发布G720GPU：第五代GPU架构节省40%带宽此前的ArmGPU架构使用的还是基于贴图（tile）的渲染技术，在G720使用的第五代GPU架构使用了全新的DVS（DeferredVertexShading，延迟顶点着色）技术。DVS技术的好处就是顶点着色的过程中，在执行阶段才会载入内存中，不像之前那样需要两次载入内存，因此大幅降低了对带宽的要求。在手机等移动平台的图形渲染中，内存带宽会消耗1/3的功耗，因此DVS技术可以大幅降低游戏功耗，提升续航，同时也提高了能效。根据Arm公布的数据，在《精灵废墟》游戏中带宽节省了41%，《原神》中节省了33%带宽，《堡垒之夜》中为26%，甚至在CAD的应用中也可以节省37%的带宽。不过DVS技术对性能的提升似乎不算夸张，峰值性能提升了15%，每瓦性能提升了15%左右。总的来说，G720的DVS架构更多地是降低了带宽需求，节省了功耗，跟CPU一样都更看重能效提升，这样倒是更符合日常使用，发热会更低，手机续航更好。另外在画质方面，Arm提及的不多，但受益于带宽节省，动态照明、景深及光追等技术也会更好，同时虚幻5引擎年底也会进入手机平台。G720系列GPU这次会分为三个级别，最高端的叫做ImmortalisG720，核心可以更多，至少10个以上，多的可达16核。往下就是Mali-G720，GPU核心数在6到9个之间，再往下就是Mali-G620，GPU核心数在5个及以下。...PC版：https://www.cnbeta.com.tw/articles/soft/1362215.htm手机版：https://m.cnbeta.com.tw/view/1362215.htm

Intel Lunar Lake架构全公开：功耗大降40％、E核性能飙升4倍

IntelLunarLake架构全公开：功耗大降40％、E核性能飙升4倍现在，Intel完全公开了LunarLake的架构设计细节，涵盖模块化结构、封装工艺、P性能核、E能效核、混合架构与线程调度、GPU核显、NPUAI引擎、平台连接等部分。我们逐一来看。【模块化与封装】首先说一句，Intel尚未明确公布LunarLake的制造工艺，目前第三方说法是主要采用台积电N3B，也就是台积电第二代3nm。不过Intel强调，如今的处理器设计理念是架构、工艺彼此99％的解耦分离，不再互相依赖，可以各自独立推进路线图。LunarLake延续了MeteorLake的分离式模块化设计，但又截然不同，首先是简化为计算模块(ComputeTile)、平台控制器模块(PlatformControllerTile)两大部分，角落里还有个填料模块(FillerTile)，不具备实际电路和功能，只是将整体凑成一个方形以保证结构强度。它们通过底部的基础模块，结合Foveros封装工艺，组合在一起。其次，LunarLake还整合封装了两颗内存。计算模块内包含最多四个P核、最多四个E核、GPU核显、媒体引擎、显示引擎、IPU图像处理单元、NPUAI单元、NOC、MSC(内存侧缓存)等。其中，MSC缓存最大容量8MB，独立于二三级缓存，主要用于IO引擎的缓存配合，可以减少对系统内存的依赖，提升延迟与带宽。平台计算模块则包含PCIe5.0/4.0控制器、雷电4控制器(没有雷电5)、USB控制器、Wi-Fi与蓝牙控制器、安全引擎等。注意，MeteorLake上的超低功耗E核取消了，因为它改变了模块组合，并且引入了新的“低功耗岛”(LowPowerIsland)，不再是单一物理模块管理节能，而是将是所有可节能的模块纳入统一管理，整体按需开关，效率更高。计算模块内部通过HomeAgent、CoherencyAgent等连接主要单元，平台控制器模块内部也有IOCoherency，确保彼此一致性地高效通信。而在两大模块之间，通过可扩展的第二代交叉总线，以及D2D界面进行彼此互连，这相比LunarLake的四大模块更加简单高效。这是Intel第一次在处理器内部封装整合内存，称之为“MemoryonPackage”，也就是“封装级内存”(MOP)。它采用的是LPDDR5X规格，最高频率8500MHz，每颗芯片四个16-bit通道，总容量最高32GB。官方称这种设计可以节省40％的功耗，并节省多达250平方毫米的主板面积，从而可以显著提升电池续航，并留出空间给笔记本的其他设计。但是注意，LunarLake笔记本不再支持独立的SO-DIMM内存，不能扩展和升级。值得一提的是，LunarLake还设计了全新的独立电源管理单元，一共四组，可以提供更多供电电路，动态调节电压。【P性能核与E能效核】这是P核结构简图，代号LionCove，在微架构上进行了全面的彻底改进，大幅提升IPC并增强可扩展性，优化了每瓦性能(尤其是单线程)，以及单位面积的性能。它共有多达18个执行端口，吞吐量和效率更高，预测宽度也提升了8倍。缓存系统大大增强，每核心一级数据缓存48KB，一级指令缓存192KB，二级缓存最多达2.5MB(ArrowLake上最多3MB)，同时所有核心共享最多12MB三级缓存。频率控制也更加精细，间隔从100MHz大大缩小到16.7MHz，效果自然是能效更高。官方宣称，新性能核的IPC性能比上代有着平均14％的提升，而且功耗越低，提升越明显，超低功耗下可达18％。如果频率也能进一步提升，性能自然会更好，这一点要到后续公布具体型号规格的时候才知道了。E能效核代号Skymont，也是全新设计的，号称Intel最节能的架构。它重点扩展了工作范围、提升了多线程性能，也提高了整体的扩展性，以及加强预测以快速寻找指令、调度端口增至26个、队列加深以更快并行处理、分配和回退加快等等，通过四个128位FP浮点单元和SIMD矢量单元，带来了两倍的矢量性能和AI吞吐量，可以更好地执行VNNI，对于AIPC的整体表现提升有很大裨益。缓存机制与P核截然不同，每个核心有32KB一级数据缓存，所有核心共享最多4MB二级缓存，没有自己的三级缓存。单线程性能可以在1/3的功耗下，平均提升多达68％，最高可接近翻倍。多线程性能方面，四个E核组成一个集群，相比于MeteorLake上的双核集群，只需要1/3的功耗，就能带来2.9倍的性能，单纯比较性能更是最高可以带来惊人的4倍提升。P、E核组合，前者峰值性能提升超过50％，后者能效提升20-80％，可以更灵活地适应对高性能、低功耗等不同应用场景的需求，覆盖各种能效范围。针对混合架构的调度，Intel12代酷睿就引入了硬件线程调度器(ThreadDirector)，LunarLake上进行了全新升级，结合操作系统的调度器，带来了动态的调度策略、增强的算法、更精细的控制等。还设置了操作系统隔离区，加强了电源管理，可以将应用能效降低多达35％。P核和E核之间，只要工作负载合适，就会首选分配给单个P核，多线程负载时再扩展到其他能效核，并按需导向性能核。上图就是Office办公下的核心调度实例。此外，Intel也给予了OEM厂商更大的灵活度，可以选择设置性能模式、能效模式。【GPU核显】LunarLake的核显升级为第二代Xe2微架构，也就是和即将发布的Battlemage独立显卡是同宗同源的，只是针对低功耗、高能效进行了优化。Xe2GPU架构引入了8个第二代Xe2核心、全新的XMX引擎(INT8整数操作每秒4096和FP16浮点操作每秒2048)、最多8个更强的光追单元、更大的XeSS内核、Xe2矢量引擎(优化能效和AI性能)、8MB二级缓存、eDP1.5视频输出等等。官方称其性能提升了多达50％，AI算力也高达67TOPS。全新的媒体引擎支持AV1硬件编解码、H.266/VVC视频硬解码。其中VVC，一如之前从H.264到H.265/HEVC，可以在保持同等画质的前提下继续降低码率、文件体积，并支持自适应分辨率码率，更加灵活，还支持屏幕内容编码流(SCC)、360度全景码流。显示引擎支持HDMI2.1、DP2.1、eDP1.5，最多三个屏幕，其中eDP1.5自然是配合笔记本自带屏幕，可以更好地适应屏幕自刷新以进一步节能，使用提前传输进行选择性的显示内容更新。【NPUAI引擎】NPUAI单元别看是第二次独立提出，但是按照Intel的技术演进，号称已经是4.0版本(背刺隔壁第三代)，在设计理念上增加大小以适应下一代AI负载，提升频率和能效，并针对现代AI进行优化以高效地运行新的大语言模型和Transformer。NPU4配备了6个神经计算引擎、12个增强的SHAVEDSP、能效优化的MAC阵列，带来了2倍的带宽和48TOPS的算力，峰值性能提升可多达4倍。相比于AMDStrixPoint也就是锐龙AI300系列的第三代NPU，算力略逊了一筹，后者达到了50TOPS。LunarLake处理器的整体算力将达到120TOPS，其中NPU适用于持续性的AI负载，能效非常高，GPU适合高性能的游戏和创作AI应用，CPU算力只有5TOPS，适合轻型、通用型AI负载。AMD尚未公布锐龙AI300系列中CPU、GPU的算力，整体孰强孰弱还有待观察。【平台连接】IO与连接方面，LunarLake提供最多四条PCIe5.0、四条PCIe4.0总线通道，可以连接两块SSD，或者一块SSD和其他扩展。无线升级到了Wi-Fi7(5GGig)，最高速率达5.8Gbps，还有蓝牙5.4。当然更少不了Intel独家的雷电4，带宽40Gbps，最多三个连接，而且支持新的雷电共享技术，可以在不同PC之间快捷分享、传输、控制。【产品上市】这就是LunarLake在架构设计上的主要情况了，可以说进步是方方面面的，就看最终的实际性能表现了。Intel已经向厂商和开发者提供一个迷你机形式的开发套件，但没有公布具体情况，而且Intel也不再做NUC迷你机了，殊为可惜。今年第三季度开始，我们将看到超过20家厂商的超过80款LunarLake笔记本陆续上市。AIPC应用也在迅速丰富起立，Intel平台上已有100多家厂商的300多个AI软件功能，优化的大模型也已超过500个。Intel预计到202...PC版：https://www.cnbeta.com.tw/articles/soft/1433619.htm手机版：https://m.cnbeta.com.tw/view/1433619.htm

ARM新款CPU和GPU发布，手机芯片将向何处行？

ARM新款CPU和GPU发布，手机芯片将向何处行？三款CPU架构登场，核心数能堆到14颗这次ARM带来了三款全新的CPU架构，即Corte-X4超大核、大核A720和能效核A520，分别对应上一代的Cortex-X3、A715和A510。三款新架构基于ARMV9.2指令集，相比上一代的ARMV9.0在性能、并行性等方面的支持均有升级。官方给出的数据显示，X4超大核提升了15%的性能、降低了40%的功耗，L2缓存可增加到2MB；A720提升了20%的能效、同频性能提升15%；A520提升了22%的能效。而且，ARM给出的架构组合从“1+3+4”变成了“1+5+2”，即把大核A720的数量增加到5个，这意味着大核要扮演的角色将会变得更加重要，成为主力核心。ARM官方表示，用新架构的“1+5+2”芯片，性能比上一代“1+3+4”的芯片强27%。（图源ARM官方）值得注意的是，上一代的A510，即2022版A510，相比2021版A510提升不太明显，只是小幅升级了能效，现在推出的A520才算是正儿八经的升级款。这次，A520彻底放弃了对32位应用的支持，未来基于新一代架构打造的CPU产品，都将不支持32位应用。也就是说，未来的Android开发者们，无论如何都得上64位应用了，Android生态里的老大难问题总算是要彻底解决了。（图源ARM官方）ARM还带来新的DynamIQ管理内核DSU-120，最高支持14核心芯片，即10颗X4+4颗A720的组合。这样强悍的架构组合，应该不是给手机用的，估计会用在笔记本等PC类产品上。简单总结下，ARM发布的三款CPU架构，性能更强了、能耗更低了、核心数更多了，并且将完全放弃32位应用。ARM第五代GPU来了，主打游戏场景目前手机端的高负载场景首推游戏，而GPU的表现至关重要。除了新的CPU架构，ARM还带来新一代的GPU架构，它们包括ImmortalisG720、MaliG720和MaliG620。这其中综合实力最强的是ImmortalisG720，和上一代ImmortalisG715相比，它的每瓦性能和峰值性能均增加了15%。（图源ARM官方）ImmortalisG720采用了延迟顶点着色延迟顶点着色（DeferredVertexShading,DVS），ARM官方表示，它能减少对内存和带宽资源的占用，能将带宽使用降低40%。根据ARM的实测，得益于DVS技术，ImmortalisG720实际性能提升20%。（图源ARM官方）ARM新闻稿披露，在堡垒之夜游戏中，ImmortalisG720的带宽使用减少了26%；知名高负载游戏原神中，带宽占用进一步减少到33%。内存和带宽利用率提高，意味着能降低GPU面临的性能压力，开发者也能把更多资源分配在其他地方。ARM还认为，手机芯片发热，很大一部分原因是内存访问频繁。DVS技术的应用，能够显著降低功耗。ImmortalisG720的核心数量10个起步，最多能到16个，另外它会标配光追功能。MaliG720则更像是ImmortalisG720的降配版，核心数量为6-9个，光追不是标配而是可选功能。而Mali620的核心数最多只有5颗，感觉它应该会用在中低端芯片上。ARM表示，这次发布的新款GPU有着有史以来最高水平的能效表现，比上一代平均能效高15%，峰值性能平均提升了15%。不难看出，ImmortalisG720是ARM目前最能打的GPU，升级幅度还是比较明显的，尤其是DVS技术的加入，让的实际表现能有更进一步的提升。不过，不同于CPU架构，目前市面上头部手机芯片厂商，采用ARM公版GPU的并不多。以高通来说，它自家的Adreno的综合实力更胜一筹。ARM发力，高通联发科下一代旗舰SoC已无悬念？如无意外的话，ARM此次发布的新一代CPU和GPU架构，将会在新款的旗舰SoC上出现。目前手机芯片市场上，除了自产自销的苹果之外，真正的玩家其实只有高通和联发科两家。而它们两年底将发布的下一代旗舰SoC，基本可以确定会采用ARM的新架构，高通和联发科的新款旗舰芯片，也已经有很多爆料了。5月中旬时，知名爆料博主@数码闲聊站放出消息称，骁龙8Gen3确定将采用“1+5+2”组合，只会配备一个X4超大核。结合ARM新品来看，这条爆料的准确度还是很高的。他还表示，骁龙8Gen3的安兔兔跑分大概是160W，而骁龙8Gen2的跑分则是133万左右。如果按照这个数据粗略换算下，高通下一代旗舰芯片的性能提升幅度大概是20%。（图源微博截图）紧接着，另一名爆料博主@i冰宇宙则表示，骁龙8Gen3配备的GPU型号为Adreno750，性能会有大幅提升，CPU的三缓容量将增加到10MB。最近，海外爆料者@YogeshBrar透露，12月将发布的一加12，将采用骁龙8Gen3芯片。目前，骁龙8Gen3应该有部分工程版，一加已经在测试。虽然还没有消息，但从以往经验来看，小米等Android厂商应该也在对骁龙8Gen3进行测试。另外，关于联发科的下一代旗舰芯片，官方自己已经主动爆料了。就在ARM发布新一代架构后不久，联发科官方微博发布了一段联发科高管致辞的视频，其中提到，下一代天玑旗舰芯片会采用Cortex-X4、A720和ImmortalisG720。一直以来，联发科芯片基本都会用ARM公版GPU，现在可以确定，天玑9300会全量用上ARM新一代的CPU和GPU架构。（图源微博截图）小雷个人猜测，天玑9300的CPU组合，应该和高通一样是“1+5+2”。之前@数码闲聊站在微博评论中表示网友“2+4+2还是2+3+3”的猜测不够大胆，ARM这次发布会也把“1+5+2”的样品来做案例。所以，综合来看，骁龙8Gen3和天玑9300会采用同样的CPU架构组合。数码闲聊站还表示，天玑9300将采用台积电N4P工艺，首发厂商仍然是vivo，首款天玑9300机型大概是vivoX100系列。手机芯片也越来越卷了！作为手机设备的心脏，SoC的重要性不言而喻。现在手机SoC所要承担的任务越来越多、越来越复杂，AI计算、影像处理、通讯连接等一系列场景和功能都由它来实现。不过，对普通用户来说，最容易感知到的还是SoC最传统的CPU和GPU两个部分，毕竟它们直接决定了日常使用的流畅度以及游戏性能表现。这次ARM发布的新架构展现出的手机芯片进化方向，仍然是提升性能、降低功耗。作为移动平台上的产品，SoC降低功耗其实比提升性能更重要。受限于散热和供电，手机芯片的功耗问题一直很敏感。而手机芯片的能效提升，最主要就来自于工艺制程和架构的提升。工艺这块是台积电三星需要操心的事情，而ARM要做的就是持续升级架构，提升效率。就ARM公布的数据来看，新一代的CPU和GPU架构，均有较大幅度的能效提升。（图源微博截图）实际上，就当前手机产品的情况来看，芯片CPU性能已经很难跑满。ARM主推的“1+5+2”架构，也是把发力点放在了大核而非超大核上，利用能效提升堆大核的量，让性能大幅提升的同时，不会造成太大的功耗负担。在CPU性能有过剩趋势时，降低功耗带来更好的实际体验，会是更正确的做法。至于GPU部分，能持续压榨其性能的主要是游戏场景，更高负载游戏的持续出现倒逼着手机芯片不断死磕GPU性能。ARM新一代GPU就围绕着游戏场景做了很多设计，比如DVS技术用来提升游戏场景对内存、贷款资源的利用效率，降低负载和功耗。ARMGPU上搭载的光追等技术，则可以给游戏带来更好的画面表现。总的来看，移动端GPU的发展方向，有点越来越像电脑上的显卡了。过去大量PC独显才有的特性和功能，未来会逐渐出现在手机端。当然，游戏生态是一个更大的命题，以光追技术来说，不仅需要ARM提供顶层的技术方案、高通联发科这些厂商做好配套，同时要终端品牌完成产品落地，还要游戏开发商做好适配。ARM此次发布的新一代架构，将会对芯片、手机以及游戏领域产生深远的影响，这些行业新一轮的内卷要开启了。...PC版：https://www.cnbeta.com.tw/articles/soft/1362383.htm手机版：https://m.cnbeta.com.tw/view/1362383.htm

天玑9300将于10月登场：首次全大核架构性能狙击苹果A17

天玑9300将于10月登场：首次全大核架构性能狙击苹果A17目前业内对于天玑9300期待很大，因为这是第一次8核CPU将全大核架构设计，采用4*Cortex-X4+4*Cortex-A720的组合，取消了凑数小核心。虽然没有小核心会给大家带来功耗上的担忧，但是按照Arm官方说法，Cortex-X4的性能提升超过15%、功耗减少40%，而Cortex-A720的能效也增长了20%。这两者组合，可以做到性能大增的同时大幅降低功耗，可以彻底结束大小核组合的时代。此前有爆料提到，天玑9300可以做到性能性能可以狙击苹果A17芯片，而纸面功耗甚至相较上一代还降低了50%以上。另外，纯64位的推进，也会让手机日常使用中的运行速度更快更流畅，算是告别了以往大家使用手机的痛点：卡顿和耗电。值得一提的是，近日SK海力士还宣布，其LPDDR5T移动DRAM已在天玑9300平台完成性能验证，速度达到了9.6Gbps，比上一代的LPDDR5X快13%，成为全球最快移动内存。届时，两者的组合将会突破如今安卓的性能极限，LPDDR5T也有望在vivoX100系列上首发。...PC版：https://www.cnbeta.com.tw/articles/soft/1376549.htm手机版：https://m.cnbeta.com.tw/view/1376549.htm

联发科天玑9400首发Arm黑鹰架构目标是超越骁龙8 Gen4

联发科天玑9400首发Arm黑鹰架构目标是超越骁龙8Gen4访问：NordVPN立减75%+外加3个月时长另有NordPass密码管理器经过内部严格验证，Arm黑鹰架构的IPC性能表现卓越，超过了苹果A17Pro和高通自研架构Nuvia。对于熟悉芯片技术的资深玩家而言，IPC是衡量芯片架构性能的重要指标，它决定了同等频率下芯片的性能表现，高IPC意味着芯片性能具有更大的潜力。因此，可以预见，天玑9400的全大核CPU在性能方面将占据领先地位。另外，天玑9400将首次采用台积电3nm工艺制程，在前代基础上继续优化功耗，这将是Android阵营第一颗3nm手机芯片。根据爆料，联发科今年则是稳扎稳打，天玑9400将采用Armv9新一代IP打造的Blackhawk黑鹰架构，让Cortex-X5超大核的性能大增，且能效表现也非常出众。“数码闲聊站”爆料称，天玑9400目标是性能和能效稳赢竞品，会用上新一代台积电3nm，并且在前代基础上继续优化功耗。CPU部分仍然是全大核的设计方案，包括一个X5超大核、三个X4大核、四个A720小核。据此前消息，联发科内部验证，天玑9400的IPC已获得积极认可，其中黑鹰超大核Cortex-X5在IPC性能上已超越A17Pro，刷新行业纪录。高IPC值意味着芯片在同等频率下拥有更出色的性能表现，类似于手机相机中的大底传感器，底越大图片质量越好。BlackHawk架构、X5超大核和全大核架构三大利器加身，天玑9400或许会成为今年最强的Android手机芯片，非常值得期待。这颗芯片会在今年10月份前后登场，预计由vivoX200系列首发搭载。...PC版：https://www.cnbeta.com.tw/articles/soft/1431278.htm手机版：https://m.cnbeta.com.tw/view/1431278.htm

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人