四核Tiger Lake CPU性能打平对手八核,Xe架构核显跑分超越Vega 7

四核TigerLakeCPU性能打平对手八核,Xe架构核显跑分超越Vega7https://www.expreview.com/74799.html牙膏这次的显卡是LPDDR4X4266,农企的是DDR43200。对了,根据群友对Lenovo小新Pro132020Ryzen版的测试,DDR43200的内存但FCLK跑2133,这会损失一部分性能,不知道这个测试的机器是不是有类似的情况

相关推荐

封面图片

英特尔将推出以下四款全小核阵容 Alder Lake-N 处理器,包含Xe-LP 架构的核显,最高 32EU。

英特尔将推出以下四款全小核阵容AlderLake-N处理器,包含Xe-LP架构的核显,最高32EU。IntelProcessorN1004C/4T6WIntelProcessorN2004C/4T6WIntelCorei3N3008C/8T7WIntelCorei3N3058C/8T15WN3051.8GHz~3.7GHz,2MBL2,6MBL3。意思是win板的性能和续航有救了?

封面图片

Intel Lunar Lake架构全公开:功耗大降40%、E核性能飙升4倍

IntelLunarLake架构全公开:功耗大降40%、E核性能飙升4倍现在,Intel完全公开了LunarLake的架构设计细节,涵盖模块化结构、封装工艺、P性能核、E能效核、混合架构与线程调度、GPU核显、NPUAI引擎、平台连接等部分。我们逐一来看。【模块化与封装】首先说一句,Intel尚未明确公布LunarLake的制造工艺,目前第三方说法是主要采用台积电N3B,也就是台积电第二代3nm。不过Intel强调,如今的处理器设计理念是架构、工艺彼此99%的解耦分离,不再互相依赖,可以各自独立推进路线图。LunarLake延续了MeteorLake的分离式模块化设计,但又截然不同,首先是简化为计算模块(ComputeTile)、平台控制器模块(PlatformControllerTile)两大部分,角落里还有个填料模块(FillerTile),不具备实际电路和功能,只是将整体凑成一个方形以保证结构强度。它们通过底部的基础模块,结合Foveros封装工艺,组合在一起。其次,LunarLake还整合封装了两颗内存。计算模块内包含最多四个P核、最多四个E核、GPU核显、媒体引擎、显示引擎、IPU图像处理单元、NPUAI单元、NOC、MSC(内存侧缓存)等。其中,MSC缓存最大容量8MB,独立于二三级缓存,主要用于IO引擎的缓存配合,可以减少对系统内存的依赖,提升延迟与带宽。平台计算模块则包含PCIe5.0/4.0控制器、雷电4控制器(没有雷电5)、USB控制器、Wi-Fi与蓝牙控制器、安全引擎等。注意,MeteorLake上的超低功耗E核取消了,因为它改变了模块组合,并且引入了新的“低功耗岛”(LowPowerIsland),不再是单一物理模块管理节能,而是将是所有可节能的模块纳入统一管理,整体按需开关,效率更高。计算模块内部通过HomeAgent、CoherencyAgent等连接主要单元,平台控制器模块内部也有IOCoherency,确保彼此一致性地高效通信。而在两大模块之间,通过可扩展的第二代交叉总线,以及D2D界面进行彼此互连,这相比LunarLake的四大模块更加简单高效。这是Intel第一次在处理器内部封装整合内存,称之为“MemoryonPackage”,也就是“封装级内存”(MOP)。它采用的是LPDDR5X规格,最高频率8500MHz,每颗芯片四个16-bit通道,总容量最高32GB。官方称这种设计可以节省40%的功耗,并节省多达250平方毫米的主板面积,从而可以显著提升电池续航,并留出空间给笔记本的其他设计。但是注意,LunarLake笔记本不再支持独立的SO-DIMM内存,不能扩展和升级。值得一提的是,LunarLake还设计了全新的独立电源管理单元,一共四组,可以提供更多供电电路,动态调节电压。【P性能核与E能效核】这是P核结构简图,代号LionCove,在微架构上进行了全面的彻底改进,大幅提升IPC并增强可扩展性,优化了每瓦性能(尤其是单线程),以及单位面积的性能。它共有多达18个执行端口,吞吐量和效率更高,预测宽度也提升了8倍。缓存系统大大增强,每核心一级数据缓存48KB,一级指令缓存192KB,二级缓存最多达2.5MB(ArrowLake上最多3MB),同时所有核心共享最多12MB三级缓存。频率控制也更加精细,间隔从100MHz大大缩小到16.7MHz,效果自然是能效更高。官方宣称,新性能核的IPC性能比上代有着平均14%的提升,而且功耗越低,提升越明显,超低功耗下可达18%。如果频率也能进一步提升,性能自然会更好,这一点要到后续公布具体型号规格的时候才知道了。E能效核代号Skymont,也是全新设计的,号称Intel最节能的架构。它重点扩展了工作范围、提升了多线程性能,也提高了整体的扩展性,以及加强预测以快速寻找指令、调度端口增至26个、队列加深以更快并行处理、分配和回退加快等等,通过四个128位FP浮点单元和SIMD矢量单元,带来了两倍的矢量性能和AI吞吐量,可以更好地执行VNNI,对于AIPC的整体表现提升有很大裨益。缓存机制与P核截然不同,每个核心有32KB一级数据缓存,所有核心共享最多4MB二级缓存,没有自己的三级缓存。单线程性能可以在1/3的功耗下,平均提升多达68%,最高可接近翻倍。多线程性能方面,四个E核组成一个集群,相比于MeteorLake上的双核集群,只需要1/3的功耗,就能带来2.9倍的性能,单纯比较性能更是最高可以带来惊人的4倍提升。P、E核组合,前者峰值性能提升超过50%,后者能效提升20-80%,可以更灵活地适应对高性能、低功耗等不同应用场景的需求,覆盖各种能效范围。针对混合架构的调度,Intel12代酷睿就引入了硬件线程调度器(ThreadDirector),LunarLake上进行了全新升级,结合操作系统的调度器,带来了动态的调度策略、增强的算法、更精细的控制等。还设置了操作系统隔离区,加强了电源管理,可以将应用能效降低多达35%。P核和E核之间,只要工作负载合适,就会首选分配给单个P核,多线程负载时再扩展到其他能效核,并按需导向性能核。上图就是Office办公下的核心调度实例。此外,Intel也给予了OEM厂商更大的灵活度,可以选择设置性能模式、能效模式。【GPU核显】LunarLake的核显升级为第二代Xe2微架构,也就是和即将发布的Battlemage独立显卡是同宗同源的,只是针对低功耗、高能效进行了优化。Xe2GPU架构引入了8个第二代Xe2核心、全新的XMX引擎(INT8整数操作每秒4096和FP16浮点操作每秒2048)、最多8个更强的光追单元、更大的XeSS内核、Xe2矢量引擎(优化能效和AI性能)、8MB二级缓存、eDP1.5视频输出等等。官方称其性能提升了多达50%,AI算力也高达67TOPS。全新的媒体引擎支持AV1硬件编解码、H.266/VVC视频硬解码。其中VVC,一如之前从H.264到H.265/HEVC,可以在保持同等画质的前提下继续降低码率、文件体积,并支持自适应分辨率码率,更加灵活,还支持屏幕内容编码流(SCC)、360度全景码流。显示引擎支持HDMI2.1、DP2.1、eDP1.5,最多三个屏幕,其中eDP1.5自然是配合笔记本自带屏幕,可以更好地适应屏幕自刷新以进一步节能,使用提前传输进行选择性的显示内容更新。【NPUAI引擎】NPUAI单元别看是第二次独立提出,但是按照Intel的技术演进,号称已经是4.0版本(背刺隔壁第三代),在设计理念上增加大小以适应下一代AI负载,提升频率和能效,并针对现代AI进行优化以高效地运行新的大语言模型和Transformer。NPU4配备了6个神经计算引擎、12个增强的SHAVEDSP、能效优化的MAC阵列,带来了2倍的带宽和48TOPS的算力,峰值性能提升可多达4倍。相比于AMDStrixPoint也就是锐龙AI300系列的第三代NPU,算力略逊了一筹,后者达到了50TOPS。LunarLake处理器的整体算力将达到120TOPS,其中NPU适用于持续性的AI负载,能效非常高,GPU适合高性能的游戏和创作AI应用,CPU算力只有5TOPS,适合轻型、通用型AI负载。AMD尚未公布锐龙AI300系列中CPU、GPU的算力,整体孰强孰弱还有待观察。【平台连接】IO与连接方面,LunarLake提供最多四条PCIe5.0、四条PCIe4.0总线通道,可以连接两块SSD,或者一块SSD和其他扩展。无线升级到了Wi-Fi7(5GGig),最高速率达5.8Gbps,还有蓝牙5.4。当然更少不了Intel独家的雷电4,带宽40Gbps,最多三个连接,而且支持新的雷电共享技术,可以在不同PC之间快捷分享、传输、控制。【产品上市】这就是LunarLake在架构设计上的主要情况了,可以说进步是方方面面的,就看最终的实际性能表现了。Intel已经向厂商和开发者提供一个迷你机形式的开发套件,但没有公布具体情况,而且Intel也不再做NUC迷你机了,殊为可惜。今年第三季度开始,我们将看到超过20家厂商的超过80款LunarLake笔记本陆续上市。AIPC应用也在迅速丰富起立,Intel平台上已有100多家厂商的300多个AI软件功能,优化的大模型也已超过500个。Intel预计到202...PC版:https://www.cnbeta.com.tw/articles/soft/1433619.htm手机版:https://m.cnbeta.com.tw/view/1433619.htm

封面图片

NVIDIA自研4nm CPU跑分超越阿里128核CPU登顶第一

NVIDIA自研4nmCPU跑分超越阿里128核CPU登顶第一在自研CPU上,NVIDIA去年就公布了GraceCPU服务器处理器,这是一款高达144核的ARM处理器,日前在hotchips会议上NVIDIA又公布了Grace的架构细节及跑分,SPECrate2017_int_base最高可达740分,不仅超过了AMD及Intel的x86旗舰,也超过了前不久拿下第一的阿里倚天710处理器。GraceCPU之前说是5nm工艺,现在确认是5nm改良版的4nm定制版,单核心可达72核,双芯下可达144核,L3缓存117MB(双芯下234MB),内部芯片互联带宽可达3.2TB/s,支持68路PCIe5.0,支持16通道LPDDR5X内存,带宽超过1TB/s,C2C-NVlink总线带宽高达900GB/s,是PCIe5.0的7倍性能,5倍能效。此外,NVIDIA还公布了GraceCPU的性能,单芯72核的SPECrate2017_int_base性能是370分,双芯下可达740分,并行效率非常高,基本上是线性提升。这个性能是什么概念呢?hardwarexxx网站汇总了多个SPECrate2017_int_base分数,AMD及Intel的36核或者64核x86处理器,同时也超过了阿里的倚天710。740分的SPECrate2017_int_base性能是目前最高的,不仅遥遥领先倚天710是阿里自研的5nm128核ARM服务器处理器,之前以510分的成绩成为SPECrate2017_int_base第一,现在被NVIDIA的144核CPU超越了也是正常,毕竟在内存及互连架构上NVIDIA的设计更恐怖。PC版:https://www.cnbeta.com/articles/soft/1307053.htm手机版:https://m.cnbeta.com/view/1307053.htm

封面图片

Intel 13代酷睿核显变强了:看齐AMD Vega10

Intel13代酷睿核显变强了:看齐AMDVega10在AMDZen4锐龙7000上,AMD只是象征性地配置了2CU规模的GPU显示单元,主要是亮机使用,中高度负载就甭想了。作为主要对手的Intel13代酷睿并没有因此放松警惕,而且从抢跑的测试分数来看,核显单元这次进一步增强了。此次现身的是一颗搭载于惠普台式机的酷睿i9-13900,识别为24核32线程,基础频率2GHz,加速频率5.3GHz,集成36MBL3。核显依然是32EU规模,频率1.65GHz。对比12900上的UHD770,EU配置没变,频率提高了100MHz,也就是6.5%。最终在OpenCL下,13代比12代的跑分提高了2.6%,基本和AMDVega10看齐,但距离MX350还有一段路。如果是和RTX3070对比,直接没法看了。从目前的爆料来看,核显似乎不是13代酷睿升级的重点,不过也欣喜能看到Intel没有减配。PC版:https://www.cnbeta.com/articles/soft/1312705.htm手机版:https://m.cnbeta.com/view/1312705.htm

封面图片

100%自主指令 龙芯3D5000高性能CPU发布:四路128核、4倍性能

100%自主指令龙芯3D5000高性能CPU发布:四路128核、4倍性能龙芯在2020年推出了自主指令系统LoongArch,2021年到2022年以来陆续发布了面向桌面的龙芯3A5000、面向服务器的龙芯3C5000,分别是4核、16核架构,这次发布的龙芯3D5000则是2个3C5000封装,做到了32核,主要面向高性能计算。龙芯3D5000依然采用龙芯自主指令集LoongArch,这是龙芯100%自主指令,无需国外授权。龙芯官方表示,龙芯3D5000具备超强算力,性能卓越的特点,可满足通用计算、大型数据中心、云计算中心的计算需求。龙芯3D5000的推出,标志着龙芯中科在服务器CPU芯片领域进入国内领先行列。具体架构上,龙芯3D5000内部集成了32个高性能LA464内核,频率2.0GHz,支持动态频率及电压调节,片内64MBL3共享缓存,8通道DDR4-3200ECC内存,5个HT3.0高速接口,实现了双路、四路CPU扩展支持。龙芯3D5000采用LGA-4129封装,TDP功耗为300W,不过典型功耗只有150W,算下来每个CPU大约是5W功耗左右,能效还是很不错的。性能方面,龙芯3D5000的SPEC2006分数超过425,浮点部分采用了双256bit向量单元,双精度浮点性能可达1TFLOPS((1万亿次),是典型ARM核心性能的4倍。龙芯3D5000还可以搭配自研的龙芯7A2000桥片支持2路、4路CPU,单台服务器可以做到128核,4路CPU2006定浮点性能实测可达1500分以上,并行效率很高。此外,龙芯3D5000的8通道DDR4内存的Stream性能也超过50GB,桥片龙芯7A2000比上代性能提升400%。国产CPU的一大优势还有安全,龙芯3D5000在这方面也做足了功夫,专有机制可以防止Meltedown、Spectre等漏洞攻击,还在芯片内集成了安全可信模块,可以取代外置可信芯片。龙芯3D5000还支持国密算法,内嵌独立安全模块,高性能加密解密效率可达5Gbps以上,足以替代高性能密码机。基于龙芯3D5000,龙芯还推出了2路、4路服务器参考设计,CPU2006性能可达800、1500分以上,浮点性能可达2T、4TFLOPS。服务器使用的BMC(服务器远程管理控制芯片)现在也依赖国外厂商,龙芯这次还推出了自研的BMC芯片2K0500,LA264架构,频率500MHz,集成2DGDP、32bitDDR3等,支持1920x108060hz输出,支持多种管理协议,可以平替国外BMC芯片,助力服务器100%国产化。龙芯还推出了LoongArch云平台,基于龙芯3D5000、龙芯7A2000、BMC控制芯片等自主芯片支持打印云、教育云、国密、五金云、混合云等场景,实现大数据、分布式存储、人工智能、物联网、区块链、云安全及高性能计算等能力。...PC版:https://www.cnbeta.com.tw/articles/soft/1353633.htm手机版:https://m.cnbeta.com.tw/view/1353633.htm

封面图片

兆芯KX-7000 8核CPU基准测试结果揭晓:性能是KX-6000的两倍 但不如i3-10100

兆芯KX-70008核CPU基准测试结果揭晓:性能是KX-6000的两倍但不如i3-101002023年底发布的兆芯KX-7000CPU系列基于x86CenturyAvenue(世纪大道)内核架构,该公司声称其性能将是KX-6000系列的两倍。该系列有两个8核版本,每个版本都有不同的时钟速度和功耗目标。顶级型号的工作频率高达3.7GHz(基本时钟频率为3.2GHz),而低功耗型号的提升时钟频率为3.6GHz(基本时钟频率为3.0GHz)。此外,这些芯片还具有4MB二级缓存和32MB三级缓存,支持DDR5/DDR4内存,提供24条PCIeGen4通道,并支持运行LGA1700插座的平台。这些芯片在设计上也与英特尔现有的LGA1700插座CPU非常相似,具有类似的IHS。在Geekbench6中,我们看到的是入门级的兆芯KX-7000/8@CPU,它拥有8个内核、8个线程、4MB二级缓存和32MB三级缓存。该芯片的基本频率为3.0GHz,提升频率为3.3GHz,低于其标准的3.6GHz提升频率。在CPU性能方面,该芯片在单核测试中获得了823分,在多核测试中获得了3813分。相比之下,英特尔酷睿i3-10100F(彗星湖)CPU(4核8线程,主频高达4.3GHz)的得分要高得多。在同一基准测试中,它的单核测试速度快约75%,多核测试速度快约17%。兆芯KX70008核CPU的性能确实是其前代产品KX-6000的两倍多,这在意料之中,因为我们看到的是两倍的内核、更高的时钟频率和TDP。看起来,要想与AMD和英特尔的上一代产品相媲美,兆芯还有很长的路要走。与此同时,另一家中国CPU制造商龙芯(Loongson)在台式电脑领域更具竞争力,其性能可与最新一代x86台式机产品媲美。...PC版:https://www.cnbeta.com.tw/articles/soft/1424098.htm手机版:https://m.cnbeta.com.tw/view/1424098.htm

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人