四核Tiger Lake CPU性能打平对手八核，Xe架构核显跑分超越Vega 7

四核TigerLakeCPU性能打平对手八核，Xe架构核显跑分超越Vega7https://www.expreview.com/74799.html牙膏这次的显卡是LPDDR4X4266，农企的是DDR43200。对了，根据群友对Lenovo小新Pro132020Ryzen版的测试，DDR43200的内存但FCLK跑2133，这会损失一部分性能，不知道这个测试的机器是不是有类似的情况

在Telegram中查看

相关推荐

英特尔将推出以下四款全小核阵容 Alder Lake-N 处理器，包含Xe-LP 架构的核显，最高 32EU。

英特尔将推出以下四款全小核阵容AlderLake-N处理器，包含Xe-LP架构的核显，最高32EU。IntelProcessorN1004C/4T6WIntelProcessorN2004C/4T6WIntelCorei3N3008C/8T7WIntelCorei3N3058C/8T15WN3051.8GHz~3.7GHz，2MBL2，6MBL3。意思是win板的性能和续航有救了？

Intel Lunar Lake架构全公开：功耗大降40％、E核性能飙升4倍

IntelLunarLake架构全公开：功耗大降40％、E核性能飙升4倍现在，Intel完全公开了LunarLake的架构设计细节，涵盖模块化结构、封装工艺、P性能核、E能效核、混合架构与线程调度、GPU核显、NPUAI引擎、平台连接等部分。我们逐一来看。【模块化与封装】首先说一句，Intel尚未明确公布LunarLake的制造工艺，目前第三方说法是主要采用台积电N3B，也就是台积电第二代3nm。不过Intel强调，如今的处理器设计理念是架构、工艺彼此99％的解耦分离，不再互相依赖，可以各自独立推进路线图。LunarLake延续了MeteorLake的分离式模块化设计，但又截然不同，首先是简化为计算模块(ComputeTile)、平台控制器模块(PlatformControllerTile)两大部分，角落里还有个填料模块(FillerTile)，不具备实际电路和功能，只是将整体凑成一个方形以保证结构强度。它们通过底部的基础模块，结合Foveros封装工艺，组合在一起。其次，LunarLake还整合封装了两颗内存。计算模块内包含最多四个P核、最多四个E核、GPU核显、媒体引擎、显示引擎、IPU图像处理单元、NPUAI单元、NOC、MSC(内存侧缓存)等。其中，MSC缓存最大容量8MB，独立于二三级缓存，主要用于IO引擎的缓存配合，可以减少对系统内存的依赖，提升延迟与带宽。平台计算模块则包含PCIe5.0/4.0控制器、雷电4控制器(没有雷电5)、USB控制器、Wi-Fi与蓝牙控制器、安全引擎等。注意，MeteorLake上的超低功耗E核取消了，因为它改变了模块组合，并且引入了新的“低功耗岛”(LowPowerIsland)，不再是单一物理模块管理节能，而是将是所有可节能的模块纳入统一管理，整体按需开关，效率更高。计算模块内部通过HomeAgent、CoherencyAgent等连接主要单元，平台控制器模块内部也有IOCoherency，确保彼此一致性地高效通信。而在两大模块之间，通过可扩展的第二代交叉总线，以及D2D界面进行彼此互连，这相比LunarLake的四大模块更加简单高效。这是Intel第一次在处理器内部封装整合内存，称之为“MemoryonPackage”，也就是“封装级内存”(MOP)。它采用的是LPDDR5X规格，最高频率8500MHz，每颗芯片四个16-bit通道，总容量最高32GB。官方称这种设计可以节省40％的功耗，并节省多达250平方毫米的主板面积，从而可以显著提升电池续航，并留出空间给笔记本的其他设计。但是注意，LunarLake笔记本不再支持独立的SO-DIMM内存，不能扩展和升级。值得一提的是，LunarLake还设计了全新的独立电源管理单元，一共四组，可以提供更多供电电路，动态调节电压。【P性能核与E能效核】这是P核结构简图，代号LionCove，在微架构上进行了全面的彻底改进，大幅提升IPC并增强可扩展性，优化了每瓦性能(尤其是单线程)，以及单位面积的性能。它共有多达18个执行端口，吞吐量和效率更高，预测宽度也提升了8倍。缓存系统大大增强，每核心一级数据缓存48KB，一级指令缓存192KB，二级缓存最多达2.5MB(ArrowLake上最多3MB)，同时所有核心共享最多12MB三级缓存。频率控制也更加精细，间隔从100MHz大大缩小到16.7MHz，效果自然是能效更高。官方宣称，新性能核的IPC性能比上代有着平均14％的提升，而且功耗越低，提升越明显，超低功耗下可达18％。如果频率也能进一步提升，性能自然会更好，这一点要到后续公布具体型号规格的时候才知道了。E能效核代号Skymont，也是全新设计的，号称Intel最节能的架构。它重点扩展了工作范围、提升了多线程性能，也提高了整体的扩展性，以及加强预测以快速寻找指令、调度端口增至26个、队列加深以更快并行处理、分配和回退加快等等，通过四个128位FP浮点单元和SIMD矢量单元，带来了两倍的矢量性能和AI吞吐量，可以更好地执行VNNI，对于AIPC的整体表现提升有很大裨益。缓存机制与P核截然不同，每个核心有32KB一级数据缓存，所有核心共享最多4MB二级缓存，没有自己的三级缓存。单线程性能可以在1/3的功耗下，平均提升多达68％，最高可接近翻倍。多线程性能方面，四个E核组成一个集群，相比于MeteorLake上的双核集群，只需要1/3的功耗，就能带来2.9倍的性能，单纯比较性能更是最高可以带来惊人的4倍提升。P、E核组合，前者峰值性能提升超过50％，后者能效提升20-80％，可以更灵活地适应对高性能、低功耗等不同应用场景的需求，覆盖各种能效范围。针对混合架构的调度，Intel12代酷睿就引入了硬件线程调度器(ThreadDirector)，LunarLake上进行了全新升级，结合操作系统的调度器，带来了动态的调度策略、增强的算法、更精细的控制等。还设置了操作系统隔离区，加强了电源管理，可以将应用能效降低多达35％。P核和E核之间，只要工作负载合适，就会首选分配给单个P核，多线程负载时再扩展到其他能效核，并按需导向性能核。上图就是Office办公下的核心调度实例。此外，Intel也给予了OEM厂商更大的灵活度，可以选择设置性能模式、能效模式。【GPU核显】LunarLake的核显升级为第二代Xe2微架构，也就是和即将发布的Battlemage独立显卡是同宗同源的，只是针对低功耗、高能效进行了优化。Xe2GPU架构引入了8个第二代Xe2核心、全新的XMX引擎(INT8整数操作每秒4096和FP16浮点操作每秒2048)、最多8个更强的光追单元、更大的XeSS内核、Xe2矢量引擎(优化能效和AI性能)、8MB二级缓存、eDP1.5视频输出等等。官方称其性能提升了多达50％，AI算力也高达67TOPS。全新的媒体引擎支持AV1硬件编解码、H.266/VVC视频硬解码。其中VVC，一如之前从H.264到H.265/HEVC，可以在保持同等画质的前提下继续降低码率、文件体积，并支持自适应分辨率码率，更加灵活，还支持屏幕内容编码流(SCC)、360度全景码流。显示引擎支持HDMI2.1、DP2.1、eDP1.5，最多三个屏幕，其中eDP1.5自然是配合笔记本自带屏幕，可以更好地适应屏幕自刷新以进一步节能，使用提前传输进行选择性的显示内容更新。【NPUAI引擎】NPUAI单元别看是第二次独立提出，但是按照Intel的技术演进，号称已经是4.0版本(背刺隔壁第三代)，在设计理念上增加大小以适应下一代AI负载，提升频率和能效，并针对现代AI进行优化以高效地运行新的大语言模型和Transformer。NPU4配备了6个神经计算引擎、12个增强的SHAVEDSP、能效优化的MAC阵列，带来了2倍的带宽和48TOPS的算力，峰值性能提升可多达4倍。相比于AMDStrixPoint也就是锐龙AI300系列的第三代NPU，算力略逊了一筹，后者达到了50TOPS。LunarLake处理器的整体算力将达到120TOPS，其中NPU适用于持续性的AI负载，能效非常高，GPU适合高性能的游戏和创作AI应用，CPU算力只有5TOPS，适合轻型、通用型AI负载。AMD尚未公布锐龙AI300系列中CPU、GPU的算力，整体孰强孰弱还有待观察。【平台连接】IO与连接方面，LunarLake提供最多四条PCIe5.0、四条PCIe4.0总线通道，可以连接两块SSD，或者一块SSD和其他扩展。无线升级到了Wi-Fi7(5GGig)，最高速率达5.8Gbps，还有蓝牙5.4。当然更少不了Intel独家的雷电4，带宽40Gbps，最多三个连接，而且支持新的雷电共享技术，可以在不同PC之间快捷分享、传输、控制。【产品上市】这就是LunarLake在架构设计上的主要情况了，可以说进步是方方面面的，就看最终的实际性能表现了。Intel已经向厂商和开发者提供一个迷你机形式的开发套件，但没有公布具体情况，而且Intel也不再做NUC迷你机了，殊为可惜。今年第三季度开始，我们将看到超过20家厂商的超过80款LunarLake笔记本陆续上市。AIPC应用也在迅速丰富起立，Intel平台上已有100多家厂商的300多个AI软件功能，优化的大模型也已超过500个。Intel预计到202...PC版：https://www.cnbeta.com.tw/articles/soft/1433619.htm手机版：https://m.cnbeta.com.tw/view/1433619.htm

NVIDIA自研4nm CPU跑分超越阿里128核CPU登顶第一

NVIDIA自研4nmCPU跑分超越阿里128核CPU登顶第一在自研CPU上，NVIDIA去年就公布了GraceCPU服务器处理器，这是一款高达144核的ARM处理器，日前在hotchips会议上NVIDIA又公布了Grace的架构细节及跑分，SPECrate2017_int_base最高可达740分，不仅超过了AMD及Intel的x86旗舰，也超过了前不久拿下第一的阿里倚天710处理器。GraceCPU之前说是5nm工艺，现在确认是5nm改良版的4nm定制版，单核心可达72核，双芯下可达144核，L3缓存117MB（双芯下234MB），内部芯片互联带宽可达3.2TB/s，支持68路PCIe5.0，支持16通道LPDDR5X内存，带宽超过1TB/s，C2C-NVlink总线带宽高达900GB/s，是PCIe5.0的7倍性能，5倍能效。此外，NVIDIA还公布了GraceCPU的性能，单芯72核的SPECrate2017_int_base性能是370分，双芯下可达740分，并行效率非常高，基本上是线性提升。这个性能是什么概念呢？hardwarexxx网站汇总了多个SPECrate2017_int_base分数，AMD及Intel的36核或者64核x86处理器，同时也超过了阿里的倚天710。740分的SPECrate2017_int_base性能是目前最高的，不仅遥遥领先倚天710是阿里自研的5nm128核ARM服务器处理器，之前以510分的成绩成为SPECrate2017_int_base第一，现在被NVIDIA的144核CPU超越了也是正常，毕竟在内存及互连架构上NVIDIA的设计更恐怖。PC版：https://www.cnbeta.com/articles/soft/1307053.htm手机版：https://m.cnbeta.com/view/1307053.htm

Intel 13代酷睿核显变强了：看齐AMD Vega10

Intel13代酷睿核显变强了：看齐AMDVega10在AMDZen4锐龙7000上，AMD只是象征性地配置了2CU规模的GPU显示单元，主要是亮机使用，中高度负载就甭想了。作为主要对手的Intel13代酷睿并没有因此放松警惕，而且从抢跑的测试分数来看，核显单元这次进一步增强了。此次现身的是一颗搭载于惠普台式机的酷睿i9-13900，识别为24核32线程，基础频率2GHz，加速频率5.3GHz，集成36MBL3。核显依然是32EU规模，频率1.65GHz。对比12900上的UHD770，EU配置没变，频率提高了100MHz，也就是6.5%。最终在OpenCL下，13代比12代的跑分提高了2.6%，基本和AMDVega10看齐，但距离MX350还有一段路。如果是和RTX3070对比，直接没法看了。从目前的爆料来看，核显似乎不是13代酷睿升级的重点，不过也欣喜能看到Intel没有减配。PC版：https://www.cnbeta.com/articles/soft/1312705.htm手机版：https://m.cnbeta.com/view/1312705.htm

100%自主指令龙芯3D5000高性能CPU发布：四路128核、4倍性能

100%自主指令龙芯3D5000高性能CPU发布：四路128核、4倍性能龙芯在2020年推出了自主指令系统LoongArch，2021年到2022年以来陆续发布了面向桌面的龙芯3A5000、面向服务器的龙芯3C5000，分别是4核、16核架构，这次发布的龙芯3D5000则是2个3C5000封装，做到了32核，主要面向高性能计算。龙芯3D5000依然采用龙芯自主指令集LoongArch，这是龙芯100%自主指令，无需国外授权。龙芯官方表示，龙芯3D5000具备超强算力，性能卓越的特点，可满足通用计算、大型数据中心、云计算中心的计算需求。龙芯3D5000的推出，标志着龙芯中科在服务器CPU芯片领域进入国内领先行列。具体架构上，龙芯3D5000内部集成了32个高性能LA464内核，频率2.0GHz，支持动态频率及电压调节，片内64MBL3共享缓存，8通道DDR4-3200ECC内存，5个HT3.0高速接口，实现了双路、四路CPU扩展支持。龙芯3D5000采用LGA-4129封装，TDP功耗为300W，不过典型功耗只有150W，算下来每个CPU大约是5W功耗左右，能效还是很不错的。性能方面，龙芯3D5000的SPEC2006分数超过425，浮点部分采用了双256bit向量单元，双精度浮点性能可达1TFLOPS（（1万亿次），是典型ARM核心性能的4倍。龙芯3D5000还可以搭配自研的龙芯7A2000桥片支持2路、4路CPU，单台服务器可以做到128核，4路CPU2006定浮点性能实测可达1500分以上，并行效率很高。此外，龙芯3D5000的8通道DDR4内存的Stream性能也超过50GB，桥片龙芯7A2000比上代性能提升400%。国产CPU的一大优势还有安全，龙芯3D5000在这方面也做足了功夫，专有机制可以防止Meltedown、Spectre等漏洞攻击，还在芯片内集成了安全可信模块，可以取代外置可信芯片。龙芯3D5000还支持国密算法，内嵌独立安全模块，高性能加密解密效率可达5Gbps以上，足以替代高性能密码机。基于龙芯3D5000，龙芯还推出了2路、4路服务器参考设计，CPU2006性能可达800、1500分以上，浮点性能可达2T、4TFLOPS。服务器使用的BMC（服务器远程管理控制芯片）现在也依赖国外厂商，龙芯这次还推出了自研的BMC芯片2K0500，LA264架构，频率500MHz，集成2DGDP、32bitDDR3等，支持1920x108060hz输出，支持多种管理协议，可以平替国外BMC芯片，助力服务器100%国产化。龙芯还推出了LoongArch云平台，基于龙芯3D5000、龙芯7A2000、BMC控制芯片等自主芯片支持打印云、教育云、国密、五金云、混合云等场景，实现大数据、分布式存储、人工智能、物联网、区块链、云安全及高性能计算等能力。...PC版：https://www.cnbeta.com.tw/articles/soft/1353633.htm手机版：https://m.cnbeta.com.tw/view/1353633.htm

兆芯KX-7000 8核CPU基准测试结果揭晓：性能是KX-6000的两倍但不如i3-10100

兆芯KX-70008核CPU基准测试结果揭晓：性能是KX-6000的两倍但不如i3-101002023年底发布的兆芯KX-7000CPU系列基于x86CenturyAvenue（世纪大道）内核架构，该公司声称其性能将是KX-6000系列的两倍。该系列有两个8核版本，每个版本都有不同的时钟速度和功耗目标。顶级型号的工作频率高达3.7GHz（基本时钟频率为3.2GHz），而低功耗型号的提升时钟频率为3.6GHz（基本时钟频率为3.0GHz）。此外，这些芯片还具有4MB二级缓存和32MB三级缓存，支持DDR5/DDR4内存，提供24条PCIeGen4通道，并支持运行LGA1700插座的平台。这些芯片在设计上也与英特尔现有的LGA1700插座CPU非常相似，具有类似的IHS。在Geekbench6中，我们看到的是入门级的兆芯KX-7000/8@CPU，它拥有8个内核、8个线程、4MB二级缓存和32MB三级缓存。该芯片的基本频率为3.0GHz，提升频率为3.3GHz，低于其标准的3.6GHz提升频率。在CPU性能方面，该芯片在单核测试中获得了823分，在多核测试中获得了3813分。相比之下，英特尔酷睿i3-10100F（彗星湖）CPU（4核8线程，主频高达4.3GHz）的得分要高得多。在同一基准测试中，它的单核测试速度快约75%，多核测试速度快约17%。兆芯KX70008核CPU的性能确实是其前代产品KX-6000的两倍多，这在意料之中，因为我们看到的是两倍的内核、更高的时钟频率和TDP。看起来，要想与AMD和英特尔的上一代产品相媲美，兆芯还有很长的路要走。与此同时，另一家中国CPU制造商龙芯（Loongson）在台式电脑领域更具竞争力，其性能可与最新一代x86台式机产品媲美。...PC版：https://www.cnbeta.com.tw/articles/soft/1424098.htm手机版：https://m.cnbeta.com.tw/view/1424098.htm

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人