Arm发布Corte-X4/A720/520 CPU架构:淘汰32位、首次14核 功耗大降40%

Arm发布Corte-X4/A720/520CPU架构:淘汰32位、首次14核功耗大降40%除了X4、A720等CPU架构之外,Arm这次也升级了DynamIQ管理内核DSU-120,可以更好地提升CPU并行性,最高做到了14核CPU,显然是准备给ArmPC笔记本的。同时它还从之前的1+3+4架构变成了1+5+2架构,给A720这样的大核留出了更多空间,这样的暗示简直不能太明显了,毕竟年底的骁龙8G3早就传闻要上1+5+2了。这次新架构的另一个重大变化就是新架构只有AArch64位,AArch32已经被放弃了,意味着此后的Arm将转向纯64位架构,这一天也期盼已久的。来看下性能/能效的变化,X4超大核心提升了15%的性能或者40%的功耗降低,A720大核也有20%的能效提升,A520小核的能效提升了22%。作为单核性能的主力,X4超大核是Arm架构中能效最好的,同时还提升了并行性,L2缓存可提升到每核2MB。大核A720升级到了Armv9.2指令集,同样的功耗下性能比上代的A715更强,架构优化了内存读取,带来了大幅功耗降低,同样的面积下性能比A78还要高。A520小核这次最大的变化主要是放弃32位,转向纯64位,主打低功耗,而且面积减少22%的情况下性能还能提升8%。整个X4/A720/A520家族的特点就是性能提升同时能效更高,X4超大核能降低40%功耗让人狠期待,其他核心及DSU也有20%左右的能耗改善。一句话来说,今年底的骁龙8G3及天玑9300系列非常值得期待了。...PC版:https://www.cnbeta.com.tw/articles/soft/1362217.htm手机版:https://m.cnbeta.com.tw/view/1362217.htm

相关推荐

封面图片

Arm 发布 Cortex X4、A720 和 A520 内核,全面抛弃 32 位。

Arm发布CortexX4、A720和A520内核,全面抛弃32位。Arm公司今天发布了2023年的移动处理器核心设计:Cortex-X4、A720和A520,这些核心都是基于Armv9.2架构,只支持64位指令集,不再兼容32位应用。Arm公司表示,这些核心在性能和效率方面都有显著的提升,同时也加强了安全性和可扩展性。——Arm

封面图片

Arm发布G720 GPU:第五代GPU架构 节省40%带宽

Arm发布G720GPU:第五代GPU架构节省40%带宽此前的ArmGPU架构使用的还是基于贴图(tile)的渲染技术,在G720使用的第五代GPU架构使用了全新的DVS(DeferredVertexShading,延迟顶点着色)技术。DVS技术的好处就是顶点着色的过程中,在执行阶段才会载入内存中,不像之前那样需要两次载入内存,因此大幅降低了对带宽的要求。在手机等移动平台的图形渲染中,内存带宽会消耗1/3的功耗,因此DVS技术可以大幅降低游戏功耗,提升续航,同时也提高了能效。根据Arm公布的数据,在《精灵废墟》游戏中带宽节省了41%,《原神》中节省了33%带宽,《堡垒之夜》中为26%,甚至在CAD的应用中也可以节省37%的带宽。不过DVS技术对性能的提升似乎不算夸张,峰值性能提升了15%,每瓦性能提升了15%左右。总的来说,G720的DVS架构更多地是降低了带宽需求,节省了功耗,跟CPU一样都更看重能效提升,这样倒是更符合日常使用,发热会更低,手机续航更好。另外在画质方面,Arm提及的不多,但受益于带宽节省,动态照明、景深及光追等技术也会更好,同时虚幻5引擎年底也会进入手机平台。G720系列GPU这次会分为三个级别,最高端的叫做ImmortalisG720,核心可以更多,至少10个以上,多的可达16核。往下就是Mali-G720,GPU核心数在6到9个之间,再往下就是Mali-G620,GPU核心数在5个及以下。...PC版:https://www.cnbeta.com.tw/articles/soft/1362215.htm手机版:https://m.cnbeta.com.tw/view/1362215.htm

封面图片

Intel Lunar Lake架构全公开:功耗大降40%、E核性能飙升4倍

IntelLunarLake架构全公开:功耗大降40%、E核性能飙升4倍现在,Intel完全公开了LunarLake的架构设计细节,涵盖模块化结构、封装工艺、P性能核、E能效核、混合架构与线程调度、GPU核显、NPUAI引擎、平台连接等部分。我们逐一来看。【模块化与封装】首先说一句,Intel尚未明确公布LunarLake的制造工艺,目前第三方说法是主要采用台积电N3B,也就是台积电第二代3nm。不过Intel强调,如今的处理器设计理念是架构、工艺彼此99%的解耦分离,不再互相依赖,可以各自独立推进路线图。LunarLake延续了MeteorLake的分离式模块化设计,但又截然不同,首先是简化为计算模块(ComputeTile)、平台控制器模块(PlatformControllerTile)两大部分,角落里还有个填料模块(FillerTile),不具备实际电路和功能,只是将整体凑成一个方形以保证结构强度。它们通过底部的基础模块,结合Foveros封装工艺,组合在一起。其次,LunarLake还整合封装了两颗内存。计算模块内包含最多四个P核、最多四个E核、GPU核显、媒体引擎、显示引擎、IPU图像处理单元、NPUAI单元、NOC、MSC(内存侧缓存)等。其中,MSC缓存最大容量8MB,独立于二三级缓存,主要用于IO引擎的缓存配合,可以减少对系统内存的依赖,提升延迟与带宽。平台计算模块则包含PCIe5.0/4.0控制器、雷电4控制器(没有雷电5)、USB控制器、Wi-Fi与蓝牙控制器、安全引擎等。注意,MeteorLake上的超低功耗E核取消了,因为它改变了模块组合,并且引入了新的“低功耗岛”(LowPowerIsland),不再是单一物理模块管理节能,而是将是所有可节能的模块纳入统一管理,整体按需开关,效率更高。计算模块内部通过HomeAgent、CoherencyAgent等连接主要单元,平台控制器模块内部也有IOCoherency,确保彼此一致性地高效通信。而在两大模块之间,通过可扩展的第二代交叉总线,以及D2D界面进行彼此互连,这相比LunarLake的四大模块更加简单高效。这是Intel第一次在处理器内部封装整合内存,称之为“MemoryonPackage”,也就是“封装级内存”(MOP)。它采用的是LPDDR5X规格,最高频率8500MHz,每颗芯片四个16-bit通道,总容量最高32GB。官方称这种设计可以节省40%的功耗,并节省多达250平方毫米的主板面积,从而可以显著提升电池续航,并留出空间给笔记本的其他设计。但是注意,LunarLake笔记本不再支持独立的SO-DIMM内存,不能扩展和升级。值得一提的是,LunarLake还设计了全新的独立电源管理单元,一共四组,可以提供更多供电电路,动态调节电压。【P性能核与E能效核】这是P核结构简图,代号LionCove,在微架构上进行了全面的彻底改进,大幅提升IPC并增强可扩展性,优化了每瓦性能(尤其是单线程),以及单位面积的性能。它共有多达18个执行端口,吞吐量和效率更高,预测宽度也提升了8倍。缓存系统大大增强,每核心一级数据缓存48KB,一级指令缓存192KB,二级缓存最多达2.5MB(ArrowLake上最多3MB),同时所有核心共享最多12MB三级缓存。频率控制也更加精细,间隔从100MHz大大缩小到16.7MHz,效果自然是能效更高。官方宣称,新性能核的IPC性能比上代有着平均14%的提升,而且功耗越低,提升越明显,超低功耗下可达18%。如果频率也能进一步提升,性能自然会更好,这一点要到后续公布具体型号规格的时候才知道了。E能效核代号Skymont,也是全新设计的,号称Intel最节能的架构。它重点扩展了工作范围、提升了多线程性能,也提高了整体的扩展性,以及加强预测以快速寻找指令、调度端口增至26个、队列加深以更快并行处理、分配和回退加快等等,通过四个128位FP浮点单元和SIMD矢量单元,带来了两倍的矢量性能和AI吞吐量,可以更好地执行VNNI,对于AIPC的整体表现提升有很大裨益。缓存机制与P核截然不同,每个核心有32KB一级数据缓存,所有核心共享最多4MB二级缓存,没有自己的三级缓存。单线程性能可以在1/3的功耗下,平均提升多达68%,最高可接近翻倍。多线程性能方面,四个E核组成一个集群,相比于MeteorLake上的双核集群,只需要1/3的功耗,就能带来2.9倍的性能,单纯比较性能更是最高可以带来惊人的4倍提升。P、E核组合,前者峰值性能提升超过50%,后者能效提升20-80%,可以更灵活地适应对高性能、低功耗等不同应用场景的需求,覆盖各种能效范围。针对混合架构的调度,Intel12代酷睿就引入了硬件线程调度器(ThreadDirector),LunarLake上进行了全新升级,结合操作系统的调度器,带来了动态的调度策略、增强的算法、更精细的控制等。还设置了操作系统隔离区,加强了电源管理,可以将应用能效降低多达35%。P核和E核之间,只要工作负载合适,就会首选分配给单个P核,多线程负载时再扩展到其他能效核,并按需导向性能核。上图就是Office办公下的核心调度实例。此外,Intel也给予了OEM厂商更大的灵活度,可以选择设置性能模式、能效模式。【GPU核显】LunarLake的核显升级为第二代Xe2微架构,也就是和即将发布的Battlemage独立显卡是同宗同源的,只是针对低功耗、高能效进行了优化。Xe2GPU架构引入了8个第二代Xe2核心、全新的XMX引擎(INT8整数操作每秒4096和FP16浮点操作每秒2048)、最多8个更强的光追单元、更大的XeSS内核、Xe2矢量引擎(优化能效和AI性能)、8MB二级缓存、eDP1.5视频输出等等。官方称其性能提升了多达50%,AI算力也高达67TOPS。全新的媒体引擎支持AV1硬件编解码、H.266/VVC视频硬解码。其中VVC,一如之前从H.264到H.265/HEVC,可以在保持同等画质的前提下继续降低码率、文件体积,并支持自适应分辨率码率,更加灵活,还支持屏幕内容编码流(SCC)、360度全景码流。显示引擎支持HDMI2.1、DP2.1、eDP1.5,最多三个屏幕,其中eDP1.5自然是配合笔记本自带屏幕,可以更好地适应屏幕自刷新以进一步节能,使用提前传输进行选择性的显示内容更新。【NPUAI引擎】NPUAI单元别看是第二次独立提出,但是按照Intel的技术演进,号称已经是4.0版本(背刺隔壁第三代),在设计理念上增加大小以适应下一代AI负载,提升频率和能效,并针对现代AI进行优化以高效地运行新的大语言模型和Transformer。NPU4配备了6个神经计算引擎、12个增强的SHAVEDSP、能效优化的MAC阵列,带来了2倍的带宽和48TOPS的算力,峰值性能提升可多达4倍。相比于AMDStrixPoint也就是锐龙AI300系列的第三代NPU,算力略逊了一筹,后者达到了50TOPS。LunarLake处理器的整体算力将达到120TOPS,其中NPU适用于持续性的AI负载,能效非常高,GPU适合高性能的游戏和创作AI应用,CPU算力只有5TOPS,适合轻型、通用型AI负载。AMD尚未公布锐龙AI300系列中CPU、GPU的算力,整体孰强孰弱还有待观察。【平台连接】IO与连接方面,LunarLake提供最多四条PCIe5.0、四条PCIe4.0总线通道,可以连接两块SSD,或者一块SSD和其他扩展。无线升级到了Wi-Fi7(5GGig),最高速率达5.8Gbps,还有蓝牙5.4。当然更少不了Intel独家的雷电4,带宽40Gbps,最多三个连接,而且支持新的雷电共享技术,可以在不同PC之间快捷分享、传输、控制。【产品上市】这就是LunarLake在架构设计上的主要情况了,可以说进步是方方面面的,就看最终的实际性能表现了。Intel已经向厂商和开发者提供一个迷你机形式的开发套件,但没有公布具体情况,而且Intel也不再做NUC迷你机了,殊为可惜。今年第三季度开始,我们将看到超过20家厂商的超过80款LunarLake笔记本陆续上市。AIPC应用也在迅速丰富起立,Intel平台上已有100多家厂商的300多个AI软件功能,优化的大模型也已超过500个。Intel预计到202...PC版:https://www.cnbeta.com.tw/articles/soft/1433619.htm手机版:https://m.cnbeta.com.tw/view/1433619.htm

封面图片

ARM新款CPU和GPU发布,手机芯片将向何处行?

ARM新款CPU和GPU发布,手机芯片将向何处行?三款CPU架构登场,核心数能堆到14颗这次ARM带来了三款全新的CPU架构,即Corte-X4超大核、大核A720和能效核A520,分别对应上一代的Cortex-X3、A715和A510。三款新架构基于ARMV9.2指令集,相比上一代的ARMV9.0在性能、并行性等方面的支持均有升级。官方给出的数据显示,X4超大核提升了15%的性能、降低了40%的功耗,L2缓存可增加到2MB;A720提升了20%的能效、同频性能提升15%;A520提升了22%的能效。而且,ARM给出的架构组合从“1+3+4”变成了“1+5+2”,即把大核A720的数量增加到5个,这意味着大核要扮演的角色将会变得更加重要,成为主力核心。ARM官方表示,用新架构的“1+5+2”芯片,性能比上一代“1+3+4”的芯片强27%。(图源ARM官方)值得注意的是,上一代的A510,即2022版A510,相比2021版A510提升不太明显,只是小幅升级了能效,现在推出的A520才算是正儿八经的升级款。这次,A520彻底放弃了对32位应用的支持,未来基于新一代架构打造的CPU产品,都将不支持32位应用。也就是说,未来的Android开发者们,无论如何都得上64位应用了,Android生态里的老大难问题总算是要彻底解决了。(图源ARM官方)ARM还带来新的DynamIQ管理内核DSU-120,最高支持14核心芯片,即10颗X4+4颗A720的组合。这样强悍的架构组合,应该不是给手机用的,估计会用在笔记本等PC类产品上。简单总结下,ARM发布的三款CPU架构,性能更强了、能耗更低了、核心数更多了,并且将完全放弃32位应用。ARM第五代GPU来了,主打游戏场景目前手机端的高负载场景首推游戏,而GPU的表现至关重要。除了新的CPU架构,ARM还带来新一代的GPU架构,它们包括ImmortalisG720、MaliG720和MaliG620。这其中综合实力最强的是ImmortalisG720,和上一代ImmortalisG715相比,它的每瓦性能和峰值性能均增加了15%。(图源ARM官方)ImmortalisG720采用了延迟顶点着色延迟顶点着色(DeferredVertexShading,DVS),ARM官方表示,它能减少对内存和带宽资源的占用,能将带宽使用降低40%。根据ARM的实测,得益于DVS技术,ImmortalisG720实际性能提升20%。(图源ARM官方)ARM新闻稿披露,在堡垒之夜游戏中,ImmortalisG720的带宽使用减少了26%;知名高负载游戏原神中,带宽占用进一步减少到33%。内存和带宽利用率提高,意味着能降低GPU面临的性能压力,开发者也能把更多资源分配在其他地方。ARM还认为,手机芯片发热,很大一部分原因是内存访问频繁。DVS技术的应用,能够显著降低功耗。ImmortalisG720的核心数量10个起步,最多能到16个,另外它会标配光追功能。MaliG720则更像是ImmortalisG720的降配版,核心数量为6-9个,光追不是标配而是可选功能。而Mali620的核心数最多只有5颗,感觉它应该会用在中低端芯片上。ARM表示,这次发布的新款GPU有着有史以来最高水平的能效表现,比上一代平均能效高15%,峰值性能平均提升了15%。不难看出,ImmortalisG720是ARM目前最能打的GPU,升级幅度还是比较明显的,尤其是DVS技术的加入,让的实际表现能有更进一步的提升。不过,不同于CPU架构,目前市面上头部手机芯片厂商,采用ARM公版GPU的并不多。以高通来说,它自家的Adreno的综合实力更胜一筹。ARM发力,高通联发科下一代旗舰SoC已无悬念?如无意外的话,ARM此次发布的新一代CPU和GPU架构,将会在新款的旗舰SoC上出现。目前手机芯片市场上,除了自产自销的苹果之外,真正的玩家其实只有高通和联发科两家。而它们两年底将发布的下一代旗舰SoC,基本可以确定会采用ARM的新架构,高通和联发科的新款旗舰芯片,也已经有很多爆料了。5月中旬时,知名爆料博主@数码闲聊站放出消息称,骁龙8Gen3确定将采用“1+5+2”组合,只会配备一个X4超大核。结合ARM新品来看,这条爆料的准确度还是很高的。他还表示,骁龙8Gen3的安兔兔跑分大概是160W,而骁龙8Gen2的跑分则是133万左右。如果按照这个数据粗略换算下,高通下一代旗舰芯片的性能提升幅度大概是20%。(图源微博截图)紧接着,另一名爆料博主@i冰宇宙则表示,骁龙8Gen3配备的GPU型号为Adreno750,性能会有大幅提升,CPU的三缓容量将增加到10MB。最近,海外爆料者@YogeshBrar透露,12月将发布的一加12,将采用骁龙8Gen3芯片。目前,骁龙8Gen3应该有部分工程版,一加已经在测试。虽然还没有消息,但从以往经验来看,小米等Android厂商应该也在对骁龙8Gen3进行测试。另外,关于联发科的下一代旗舰芯片,官方自己已经主动爆料了。就在ARM发布新一代架构后不久,联发科官方微博发布了一段联发科高管致辞的视频,其中提到,下一代天玑旗舰芯片会采用Cortex-X4、A720和ImmortalisG720。一直以来,联发科芯片基本都会用ARM公版GPU,现在可以确定,天玑9300会全量用上ARM新一代的CPU和GPU架构。(图源微博截图)小雷个人猜测,天玑9300的CPU组合,应该和高通一样是“1+5+2”。之前@数码闲聊站在微博评论中表示网友“2+4+2还是2+3+3”的猜测不够大胆,ARM这次发布会也把“1+5+2”的样品来做案例。所以,综合来看,骁龙8Gen3和天玑9300会采用同样的CPU架构组合。数码闲聊站还表示,天玑9300将采用台积电N4P工艺,首发厂商仍然是vivo,首款天玑9300机型大概是vivoX100系列。手机芯片也越来越卷了!作为手机设备的心脏,SoC的重要性不言而喻。现在手机SoC所要承担的任务越来越多、越来越复杂,AI计算、影像处理、通讯连接等一系列场景和功能都由它来实现。不过,对普通用户来说,最容易感知到的还是SoC最传统的CPU和GPU两个部分,毕竟它们直接决定了日常使用的流畅度以及游戏性能表现。这次ARM发布的新架构展现出的手机芯片进化方向,仍然是提升性能、降低功耗。作为移动平台上的产品,SoC降低功耗其实比提升性能更重要。受限于散热和供电,手机芯片的功耗问题一直很敏感。而手机芯片的能效提升,最主要就来自于工艺制程和架构的提升。工艺这块是台积电三星需要操心的事情,而ARM要做的就是持续升级架构,提升效率。就ARM公布的数据来看,新一代的CPU和GPU架构,均有较大幅度的能效提升。(图源微博截图)实际上,就当前手机产品的情况来看,芯片CPU性能已经很难跑满。ARM主推的“1+5+2”架构,也是把发力点放在了大核而非超大核上,利用能效提升堆大核的量,让性能大幅提升的同时,不会造成太大的功耗负担。在CPU性能有过剩趋势时,降低功耗带来更好的实际体验,会是更正确的做法。至于GPU部分,能持续压榨其性能的主要是游戏场景,更高负载游戏的持续出现倒逼着手机芯片不断死磕GPU性能。ARM新一代GPU就围绕着游戏场景做了很多设计,比如DVS技术用来提升游戏场景对内存、贷款资源的利用效率,降低负载和功耗。ARMGPU上搭载的光追等技术,则可以给游戏带来更好的画面表现。总的来看,移动端GPU的发展方向,有点越来越像电脑上的显卡了。过去大量PC独显才有的特性和功能,未来会逐渐出现在手机端。当然,游戏生态是一个更大的命题,以光追技术来说,不仅需要ARM提供顶层的技术方案、高通联发科这些厂商做好配套,同时要终端品牌完成产品落地,还要游戏开发商做好适配。ARM此次发布的新一代架构,将会对芯片、手机以及游戏领域产生深远的影响,这些行业新一轮的内卷要开启了。...PC版:https://www.cnbeta.com.tw/articles/soft/1362383.htm手机版:https://m.cnbeta.com.tw/view/1362383.htm

封面图片

天玑9300将于10月登场:首次全大核架构 性能狙击苹果A17

天玑9300将于10月登场:首次全大核架构性能狙击苹果A17目前业内对于天玑9300期待很大,因为这是第一次8核CPU将全大核架构设计,采用4*Cortex-X4+4*Cortex-A720的组合,取消了凑数小核心。虽然没有小核心会给大家带来功耗上的担忧,但是按照Arm官方说法,Cortex-X4的性能提升超过15%、功耗减少40%,而Cortex-A720的能效也增长了20%。这两者组合,可以做到性能大增的同时大幅降低功耗,可以彻底结束大小核组合的时代。此前有爆料提到,天玑9300可以做到性能性能可以狙击苹果A17芯片,而纸面功耗甚至相较上一代还降低了50%以上。另外,纯64位的推进,也会让手机日常使用中的运行速度更快更流畅,算是告别了以往大家使用手机的痛点:卡顿和耗电。值得一提的是,近日SK海力士还宣布,其LPDDR5T移动DRAM已在天玑9300平台完成性能验证,速度达到了9.6Gbps,比上一代的LPDDR5X快13%,成为全球最快移动内存。届时,两者的组合将会突破如今安卓的性能极限,LPDDR5T也有望在vivoX100系列上首发。...PC版:https://www.cnbeta.com.tw/articles/soft/1376549.htm手机版:https://m.cnbeta.com.tw/view/1376549.htm

封面图片

联发科天玑9400首发Arm黑鹰架构 目标是超越骁龙8 Gen4

联发科天玑9400首发Arm黑鹰架构目标是超越骁龙8Gen4访问:NordVPN立减75%+外加3个月时长另有NordPass密码管理器经过内部严格验证,Arm黑鹰架构的IPC性能表现卓越,超过了苹果A17Pro和高通自研架构Nuvia。对于熟悉芯片技术的资深玩家而言,IPC是衡量芯片架构性能的重要指标,它决定了同等频率下芯片的性能表现,高IPC意味着芯片性能具有更大的潜力。因此,可以预见,天玑9400的全大核CPU在性能方面将占据领先地位。另外,天玑9400将首次采用台积电3nm工艺制程,在前代基础上继续优化功耗,这将是Android阵营第一颗3nm手机芯片。根据爆料,联发科今年则是稳扎稳打,天玑9400将采用Armv9新一代IP打造的Blackhawk黑鹰架构,让Cortex-X5超大核的性能大增,且能效表现也非常出众。“数码闲聊站”爆料称,天玑9400目标是性能和能效稳赢竞品,会用上新一代台积电3nm,并且在前代基础上继续优化功耗。CPU部分仍然是全大核的设计方案,包括一个X5超大核、三个X4大核、四个A720小核。据此前消息,联发科内部验证,天玑9400的IPC已获得积极认可,其中黑鹰超大核Cortex-X5在IPC性能上已超越A17Pro,刷新行业纪录。高IPC值意味着芯片在同等频率下拥有更出色的性能表现,类似于手机相机中的大底传感器,底越大图片质量越好。BlackHawk架构、X5超大核和全大核架构三大利器加身,天玑9400或许会成为今年最强的Android手机芯片,非常值得期待。这颗芯片会在今年10月份前后登场,预计由vivoX200系列首发搭载。...PC版:https://www.cnbeta.com.tw/articles/soft/1431278.htm手机版:https://m.cnbeta.com.tw/view/1431278.htm

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人