Intel的“大小核”:只是个过渡方案吗?

Intel的“大小核”:只是个过渡方案吗? “大小核”之缘起2021年10月,Intel发布了第12代酷睿处理器,正式引入了“大小核”设计,也就是官方口中的“异构多核”。当时,Intel的竞争对手(苹果、AMD)大概率能用上台积电5nm工艺,而Intel大概只能使用Intel 7工艺。要知道,台积电5nm工艺几乎可以算是领先了Intel 7工艺一个大版本,采用5nm工艺制造的CPU性能更强且更加省电。在工艺短期内无法突破瓶颈的情况下,Intel决定在芯片设计方面“整个活”,“大小核”方案应运而生。对于一款CPU来说,我们可以采用PPA进行评估,即:Performance(性能)、Power(功耗)、Area(尺寸)。换句话来说,芯片的设计目标是实现更高的性能、更低的功耗和更小的面积。Intel的“大核”:最大限度地提高单线程性能和响应速度。从PPA的角度来看,就是优先堆性能,功耗和尺寸不是很在意。不过这样的结果就是性能上限很高,但能效(每瓦可提供的性能)很差。Intel的“小核”:为现代多任务处理提供可扩展的多线程性能和高效的后台任务卸载。从PPA的角度来看就是用不是很大的功耗和尺寸实现不错的性能。这样做的结果就是能效很高,但性能上限会差一些。理想情况下,将高性能的大核与高效能的小核融合,能够灵活地应对各类任务挑战。在这种模式下,轻量负载任务可以分配小核去处理,功耗大大降低;大核则可以专注于重负载任务,无需操劳其它轻量任务。对于笔记本电脑等移动设备来说,这种模式还可以降低发热量,增强续航能力。然而现实并不理想。任务调度的困难“大小核”在电脑上的最终表现取决于很多方面的因素。由于电脑上的应用往往是直接跟操作系统“打交道”,因此操作系统的任务调度机制成为了最关键的一环。由于采用了“大小核”方案设计的CPU内部集成了两种不同性能的核心,这就造成了在调度层面上会比单一核心架构更为复杂。调度这两种核心时,需要考虑到它们各自的特点和性能差异,从而增加了调度的复杂性。我们在这里简单分析一下世界上两大系统厂商苹果和微软分别是如何解决这个问题的。首先从系统调度策略上看:苹果搞QoS比微软早,而且还比微软细。根据苹果官网上的文档显示,苹果的开发者可以设置进程的QoS等级,然后系统可以根据QoS优先级来调度。另外根据文档日志显示,该文档最初更新于2014年7月,最后更新于2016年9月。也就是说,苹果这套“解决方案”已经搞了大概10年。在这10年间,应用和系统之间的磨合已经达成了默契,每个程序应该跑大核或者小核已成定数。微软方面则是在Windows 10 1709版本才加入基本的QoS策略,而且这个QoS策略做得比较粗糙,比如对于不同窗口状态下的服务质量仅分成了高、中、低三挡。因此从系统调度策略上看,苹果胜。之后我们从软件生态和应用方面看:苹果的软件供应商更听话,更加愿意配合苹果去优化适配“大小核”。由于很多苹果用户习惯于从“苹果商店”下载应用程序,而应用程序想要上架“苹果商店”需要服从苹果的相关规范,所以对于苹果来说,让整个生态适配大小核设计是比较容易的。对于微软来说,微软长期的策略是保持强大的兼容性。比如一些很老旧的软件放在新系统上仍然能够运行。不过这些老旧软件肯定是没有QoS策略的,而对于微软来说并没有办法强制让老旧软件的原始开发者回来更新软件。所以老旧软件对于“大小核”方案的适配工作其实很难推进,而对于新软件来说,它也并不一定要写QoS策略。毕竟“微软应用商店”的存在感非常低,微软没有太好的办法强制软件商去适配“大小核”方案。因此从软件生态和应用方面看,苹果再次获胜。所以从这个局面上看,Intel要想搞“大小核”CPU,去抱苹果大腿才是最优选择。但是,Intel已经没有这个选项了。Intel在搞“大小核”的时候,苹果那边已经开始要使用自己的CPU了,也就是M1系列。所以Intel“大小核”CPU+苹果系统的组合基本上是不太可能了。这种情况下消费级市场上也就主要是Windows+Intel“大小核”方案了。虽然微软在“大小核”适配方面不太给力,但Intel方面其实也没有完全躺平。Intel推出了硬件线程调度器(Thread Director),I通过识别每个工作负载的级别并使用其能源和性能内核评分机制,帮助操作系统将线程调度到性能和效率最佳的内核上。但是官网上关于硬件线程调度器有这样一段描述需要注意:“向操作系统提供运行时反馈,以便针对任何工作负载做出最佳决策。”也就是说,“硬件线程调度器”可以向操作系统提出任务调度的相关建议,但操作系统听不听它的就是另一个问题了。所以“硬件线程调度器”并不是一个可以独立解决问题的方案,很大程度上还是需要依靠微软的配合。而且Intel这边也需要相当长的时间打磨自己的调度算法,才能让这种调度方式良好运行。Intel 3工艺与至强6“大小核”起源于工艺落后,最终也许会因为工艺进步而结束。从Intel前不久发布的至强6系列处理器中,就可以看出一些端倪。至强6处理器分成了两大产品系列能效核处理器以及性能核处理器。其中能效核处理器专门针对高核心密度和规模扩展任务所需的高效能优化,而性能核处理器则面向计算密集型和AI工作负载所需的高性能进行优化,两者架构兼容,共享软件栈和开放的软、硬件供应商生态。简言之,至强6系列处理器回到了之前的“传统”设计思路。这背后的原因,是因为至强6能效核处理器用上了Intel 3制程工艺。与上一个制程节点Intel 4相比,Intel 3实现了约0.9倍的逻辑微缩和17%的每瓦性能提升,高于业界一般标准。此外,Intel对EUV(极紫外光刻)技术的运用更加娴熟,在Intel 3的更多生产工序中增加了对EUV的应用。Intel 3还引入了更高密度的设计库,提升了晶体管驱动电流,并通过减少通孔电阻优化了互连技术堆栈。Intel现在所使用的Intel 3工艺已经不再明显落后于同行。这样一来,Intel如果回归到“每个处理器中只有一种核心”的“传统”模式,那么操作系统的调度就会相对更容易。用户的选择也会变得更容易,可以根据使用场景来选择自己需要的产品线。全面回归“传统”设计 非一朝一夕至强6处理器的问世为消费级“大小核”CPU带来了一种全新的发展思路。在当前工艺不断进步的背景下,坚持大小核设计似乎没有那么必要。回归至"传统"的设计理念可以简化复杂的任务调度问题,确实成为了一种可行的策略。然而,即便有这样的想法,实际推行起来却并非易事。现在Intel虽然有了Intel 3工艺,但由于新工艺成本高、产能有限,全面普及应该还需要很长的时间。就比如Intel于2023年10月发布的最新的第14代酷睿处理器仍然使用Intel 7工艺,连Intel 4工艺都没有用上。“大小核”方案在低功耗设备上的优势确实存在,所以Intel要放弃“大小核”方案应该会从功耗不敏感的台式机处理器入手,之后循序渐进再到笔记本平台。举例来说,即将在今年第三季度面世的针对笔记本平台的Lunar Lake处理器,依然沿用了大小核设计。这一选择无疑表明,在未来几代的笔记本平台CPU中,大小核设计仍将占据主导地位。 ... PC版: 手机版:

相关推荐

封面图片

如果看待intel纯大核14901KE?

如果看待intel纯大核14901KE? 阿财的回答 这玩意不是重新设计的,这个 Core i9-14901KE 是用14呆的大小核i7直接屏蔽小核,然后顶盖刻字上架来的,如果是重新设计纯大核,Ultra 9应该是有10~12核的 Bartlett Lake-S,纯原生12大核Intel按计划要2025年Q3才能推出。2025年Q1依然用屏蔽的8大核交差。 这里呢,目前不建议购买采用Intel 7 制程 C0和H0工艺步进的任何Intel处理器。Intel尚未查明原因: 因为可能存在潜在未知原因的不稳定缺陷。 via 知乎热榜 (author: 阿财)

封面图片

Intel宣布全新至强6:E核、P核兵分两路

Intel宣布全新至强6:E核、P核兵分两路 按照惯例,Sierra Forest、Granite Rapids应该命名为第六代至强可扩展处理器,但随着行业需求和产品技术本身的变化,Intel将其更名为至强6,也更加简洁。至强6 Sierra Forest堪称至强处理器历史上最大的一次变革,首次采用纯能效核(E核)设计,最多可以做到288核心288线程。它重点针对效率进行优化,适合高密度、可扩展的工作负载。按照官方说法,相比第二代至强,Sierra Forest可以带来2.4倍的能效提升,机架密度则可以提高2.7倍。客户能够以接近3:1的比例替换升级旧系统,从而大幅降低功耗,机架数量从200个减少到72个每年能节省100万瓦能耗,足够1300多户家庭使用一整年。至强6 Granite Rapids则是传统的纯性能核(P核)设计,重点针对性能优化,适合计算密集型、AI负载。它将新增加对MXFP4数据格式的软件支持,能够运行700亿参数的Llama 2大模型,对比四代至强能将令牌延迟缩短最多6.5倍。Sierra Forest将在今年第二季度正式发布,Granite Rapids紧随其后登场。另外,Intel确认将在今年内推出代号Lunar Lake的下一代酷睿Ultra客户端处理器,CPU+GPU+NPU平台算力超过100TOPS,其中NPU单元算力超过46TOPS,从而支持更强大的新一代AI PC。2024年内,基于酷睿Ultra处理器的消费级和商用终端产品将超过230款,100多家ISV软件厂商将针对酷睿Ultra处理器开发300多项专属的AI加速功能。Intel预计到2025年底,将出货超过1亿颗具备AI加速功能的处理器。 ... PC版: 手机版:

封面图片

Intel 公布了处理器 Roadmap

Intel 公布了处理器 Roadmap - 桌面级更新到 Raptor Lake,最高 8+16,LGA1700 沿用 - Meteor Lake 将会在计算核心上使用 Intel 4 工艺,其它部分使用台积电工艺,Intel 称将在 Meteor Lake 上获得计算、AI 和图形性能的领先优势 - Intel 3 工艺将被用于 Granite Rapids,即 Xeon 产品线 - 之后将使用 Intel 20A 工艺打造 Arrow Lake 计算核心 - 再往后是使用 Intel 18A 工艺打造 Lunar Lake,Intel 称将在 Intel 18A 工艺投入使用后重新获得能耗比的领先优势

封面图片

NVIDIA AI PC处理器曝光:Arm X5超大核、RTX 50同款GPU

NVIDIA AI PC处理器曝光:Arm X5超大核、RTX 50同款GPU NVIDIA自然不可能得到x86指令集的授权,只能依赖Arm架构。根据传闻,Arm将在今年晚些时候推出下一代高性能超大核架构,代号Blackhawk,可能会命名为Cortex-X5,高通、联发科都会第一时间跟进。最新曝料称,NVIDIA的高性能AI PC处理器就将使用Arm X5超大核,只是具体会有几个核心、频率和功耗会放宽到什么程度,还没有明确说法。同时,该处理器采用台积电高性能版3nm N3P工艺打造,同时集成RTX 50系列同款的Blackwell GPU图形核心,还会整合封装下一代LPDDR6内存,其标准规范有望在今年内正式公布,峰值频率可达14.4GHz。NVIDIA这款处理器将在2025年发布登场,微软也会将Windows 11 on Arm的所有AI相关特性导入提供支持。看起来,NVIDIA AI PC威胁最大的不是Intel、AMD,而是……高通。不知道在数日后的台北电脑展上,老黄会不会提到这颗处理器。 ... PC版: 手机版:

封面图片

ℹ传 Intel 正准备推出一款全核超频可达 5.2GHz 的 i9-12900KS 特别版最强游戏处理器#Rocky

ℹ传 Intel 正准备推出一款全核超频可达 5.2GHz 的 i9-12900KS 特别版最强游戏处理器#Rocky 对于长期都有在关注 Intel,或几乎都买 I 家处理器的朋友来说,应该还记得 2019 年时 Intel 曾推出一款包装精致,而且是限量...

封面图片

Windows将可监控AMD锐龙8040 NPU AI引擎:Intel酷睿Ultra后发却抢先

Windows将可监控AMD锐龙8040 NPU AI引擎:Intel酷睿Ultra后发却抢先 2023年底,AMD又发布了升级版的锐龙8040系列,AI性能大幅提升60%,相关笔记本已经陆续发布上市。AMD也一直在与微软合作,在锐龙8040系列移动处理器上启用MCDM(微软计算驱动程序模型)。这是WDDM(Windows显示驱动程序模型)的衍生工具,面向NPU等非GPU、计算设备,使其够利用现有的GPU设备管理功能,包括调度、电源管理、内存管理、使用任务管理器等工具进行性能调试。MCDM作为基础层,可确保AI工作负载在NPU设备上的顺利执行。至于首发的锐龙7040系列是否也能在Windows任务管理器中监控NPU,暂时不详。Intel Meteor Lake酷睿Ultra处理器也集成了NPU AI引擎,并且已经抢先显示在Windows任务管理器中,命名为“Intel AI Boost”,可实时显示NPU利用率、内存占用等数据。 ... PC版: 手机版:

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人