英特尔解释Lunar Lake如何在放弃超线程的情况下获得最佳性能
英特尔解释LunarLake如何在放弃超线程的情况下获得最佳性能如果你还记得,英特尔在第12代AlderLake处理器上推出了性能混合或"大-大"架构,将"大"性能内核或P核心与"大"效率内核或E核心相结合,这样,较重的任务将由P核心处理,而较轻的工作负载将由E核心处理。不过,尽管引入了线程指令硬件调度程序监,英特尔还是注意到了改进的机会,因为操作系统调度程序通常会将任务最后发送给超线程,因为物理内核总是优先处理。英特尔称,在LunarLake移动CPU上,其全新优化的P核心(不含HT)在单线程性能和效率方面有了显著提升。英特尔表示,超线程技术更适用于多线程性能更为重要的应用场景。下面的幻灯片详细介绍了英特尔通过禁用HT在LunarLakeP核心上观察到的性能和能效改进:英特尔补充说,这是其精简LunarLake架构的更广泛努力的一部分,即砍掉对所需性能或能效无益的部分。英特尔在下面的幻灯片中解释了这些架构的目标。如果你想知道,LionCove是LunarLakeP核架构,而Skymont是E核架构。LunarLake的另一个变化是引入了新的L0D级缓存(0级数据缓存)。LunarLakeP核(LionCove)每个内核有2.5MB的二级缓存和多达12MB的共享三级缓存。同时,E核(Skymont)拥有4MB共享二级缓存。它们由四个P核和四个E核组成集群,这种8核混合设计构成了一个LunarLake计算磁盘。它还拥有高达32GB的内置内存,有助于加快数据访问速度并减少延迟。英特尔还对英特尔线程指令(ITD)进行了修改。与前几代产品不同的是,现在只要工作负载可以由E核处理,ITD就会将任务优先安排给E核。据该公司称,采用这种方法后,MicrosoftTeams的功耗降低了35%。微软Windows核心操作系统高级软件工程师TapanAnsel和Windows核心操作系统首席软件工程主管(能效)BretBarkelew说:英特尔线程指导技术可识别LunarLake平台上最节能的CPU,Windows操作系统可利用该技术创建一个"控制区",将工作限制在这些CPU上,并保持其他性能优越的CPU处于停机/闲置状态,仅在需要时使用。这为团队视频会议场景节省了大量功耗,而这些场景都非常适合在LunarLake上的"控制区"内运行。与流星湖P核(RedwoodCove)相比,LunarLakeP核(LionCove)的IPC提高了14%(AMD声称其新Zen5的IPC提高了16%):在E核方面,英特尔称LunarLake的Skymont甚至比RaptorLake(第13代)上的P核还要快;与MeteorLake的LPE核相比,Skymont快68%,浮点(FP)吞吐量比整数吞吐量有更大的提升。最后是NPU或神经处理单元。英特尔公司声称,其新的NPU4设计有了巨大的改进。我们已经知道,英特尔公司在早些时候发布的一项声明中已经成功地达到了Copilot+PC所需的40TOPS。如上图所示,48峰值TOPS(pTOPS)比必要的40TOPS高出20%,略低于AMD昨天发布的新RyzenAI300系列的50TOPS。不过,英特尔宣称平台总性能(CPU+GPU+NPU)为120TOPS。而AMD的"处理器总性能"为80TOPS。英特尔表示,由于LunarLake的人工智能处理能力比MeteorLake有了大幅提升,因此StableDiffusion在前者上的能效也得到了大幅提高。...PC版:https://www.cnbeta.com.tw/articles/soft/1433521.htm手机版:https://m.cnbeta.com.tw/view/1433521.htm