全球第一款192核心CPU AmpereOne诞生

全球第一款192核心CPUAmpereOne诞生每核心集成两个128位矢量单元，支持FP16、BF16、INT16、INT8数据格式。每核心16KB一级指令缓存、64KB一级数据缓存、2MB二级缓存(上代1MB)，同时所有核心共享64MB三级缓存。内存支持八通道DDR5ECC(上代八通道DDR4)，单系统最多16条，最大容量8TB。扩展支持128条PCIe5.0(上代128条PCIe4.0)，来自32个控制器。功耗范围200-350W，对比上代的10-180W增加了不少。性能方面，Ampere对比了AMD、Intelx86平台，但有点另类。一是对比支持的虚拟机数量，42U16.5千瓦机架空间内，AmpereOne可多达7296个，AMD霄龙9654Genoa、Intel至强8480+SapphireRapids则分别只有2496个、1680个。但事实上，42U机架的功耗空间已经开放了很多，很多都已经增至20-50千瓦，这对于AMD、Intel当然更加有利，但是被Ampere刻意回避了。二是对比AI性能，StableDiffusion、DLRM两个项目，号称相比AMD霄龙9654分别领先2.3倍、2倍。但事实上，Ampere使用的是FP16精度，AMD则是FP32精度，并不公平，更何况FP16精度负载大多都已经交给GPU执行了。...PC版：https://www.cnbeta.com.tw/articles/soft/1360889.htm手机版：https://m.cnbeta.com.tw/view/1360889.htm

在Telegram中查看

相关推荐

Ampere宣布全球首款256核心处理器 3nm工艺、Arm架构

Ampere宣布全球首款256核心处理器3nm工艺、Arm架构访问：NordVPN立减75%+外加3个月时长另有NordPass密码管理器Ampere去年5月发布了全球第一款192核心处理器，对比前代128核心增加一半，采用台积电5nm工艺，基于Armv8.6+指令集自研的架构，还有136/144/160/172核心版本，稳定频率最高3.0GHz，每核心二级缓存翻倍至2MB，三级缓存共享64MB。内存支持八通道DDR5ECC8TB，扩展支持128条PCIe5.0，功耗范围200-350W，对比前代的DDR4、PCIe4.0全面飞跃。新一代256核心将升级为台积电N33nm工艺，但具体细节不详，估计会升级微架构，但二级缓存似乎还是每核心2MB。Ampere声称，它的性能相比市面上的其他竞品将领先超过40％，而且不仅仅是核心更多，还有更高效的性能、更好的内存和缓存，以及新的AI计算。另外，散热系统会保持不变，因此功耗最多还是350W左右。值得一提的是，Ampere还与高通达成合作，将打造基于Ampere处理器、高通CloudAI100Ultra加速器的大模型推理平台。...PC版：https://www.cnbeta.com.tw/articles/soft/1431324.htm手机版：https://m.cnbeta.com.tw/view/1431324.htm

NVIDIA 144核心超级CPU揭秘：3.5倍能效碾压AMD 128核心

NVIDIA144核心超级CPU揭秘：3.5倍能效碾压AMD128核心GraceCPU二合一GraceCPU＋HopperGPU二合一它通过NVLink-C2C芯片间互连总线，将两颗GraceCPU整合在一块基板上，彼此之间的双向带宽多达900GB/s。GraceCPU基于Armv9-A9.0架构、NeoverseV264位内核，以4个128-bit功能单元的方式配置了两组SIMD矢量指令集，一是SVE2(缩放矢量扩展第二版)，二是NEON(高级SIMD)。它还支持LSE(大型系统扩展)，可提供低成本的原子操作，改进CPU通信吞吐。NVIDIA声称，这种核心的能效，是如今服务器常见x86核心的2倍。GraceCPU单颗集成72个核心，互相通过3.2TB/s超高带宽的NVIDIA缩放一致性Fabric总线互连，而二合一的超级芯片上就是144个核心。每核心64KB一级指令缓存、64KB一级数据缓存、1MB二级缓存，一颗超级芯片的所有核心共享234MB三级缓存。内存整合封装了LPDDR5X，最大容量960GB，最高带宽1TB/s(每一颗500GB/s)，还支持ECC。对比传统的八通道DDR5，这种设计不但带宽高出53％，单位功耗也只有1/8。对比海量带宽的HBM2e，单位成本只有1/3，容量则可达8倍。扩展支持八组PCIe5.0x16，总带宽1TB/s，还有用于管理的低速PCIe通道。性能方面，一颗超级芯片的FP64双精度峰值浮点性能可达7.1TFlops(每秒7.1万亿次计算)，热设计功耗500W。NVIDIA对比了AMDZen3架构的霄龙776364核心，双路组成128核心，号称性能可领先1.5-2.5倍，能效可领先2.0-3.5倍！当然，AMD已经有了Zen4架构、最多96核心的霄龙9004系列，NVIDIAGrace依然还没有商用。...PC版：https://www.cnbeta.com.tw/articles/soft/1340283.htm手机版：https://m.cnbeta.com.tw/view/1340283.htm

全球首款64核心笔记本诞生首发分体水冷

全球首款64核心笔记本诞生首发分体水冷这台云怪REV-9笔记本采用了AMD64核心EPYC处理器，一是EPYC7713，Zen3架构，三级缓存256MB，主频2.0-3.675GHz，功耗225W，官方标价7060美元。二是EPYC9554，Zen4架构，三级缓存256MB，主频3.1-3.75GHz，功耗360W，官方定价9087美元。显卡标配桌面级RTX4060，还可以升级即将发布的RTX4080SUPER。为了镇压它们，甚至全球首次采用了分体式水冷散热、风冷水冷混合散热，内置多条热管和超大面积紫铜冷排。屏幕也是迄今最大的17.3英寸，16:9比例，默认2.5K240Hz，可切换到4K120Hz，并覆盖100%sRGB广色域。整机尺寸达到了惊人的420x325×46毫米，轻质铝合金材质加阳极氧化工艺，可选黑、银、金、玫瑰金、蓝、紫、红等多种色彩。它的侧面，甚至设置了两条音乐频谱全彩LED。价格暂未公布，尽情发挥想象吧。...PC版：https://www.cnbeta.com.tw/articles/soft/1405111.htm手机版：https://m.cnbeta.com.tw/view/1405111.htm

全球第一款RTX 4070 ITX迷你卡诞生单风扇无压力

全球第一款RTX4070ITX迷你卡诞生单风扇无压力对于散热能力，官方声称25℃室温下，风扇转速只有2400RPM，但核心、显存最高温度分别可以控制在73℃、68℃，降低了8℃、10℃。但是官方没说对比的是谁，可能是自家的双风扇标准版RTX4070。内部的PCB电路板自然也是定制的，号称专案研发，单个8针供电。虽然没有预超频，但性能释放正常，3DMarkSpeedWay跑分4442，和该卡的平均值4450基本相同。西风称该卡的第一批已经售罄，第二批将在7月中到货。...PC版：https://www.cnbeta.com.tw/articles/soft/1435072.htm手机版：https://m.cnbeta.com.tw/view/1435072.htm

1000+亿晶体管怪物 Intel GPU Max诞生一年半就被放弃

1000+亿晶体管怪物IntelGPUMax诞生一年半就被放弃据最新曝料，Intel已经告知合作伙伴，GPUMax系列将逐步停产退市，IntelAI加速器的重点将放在Guadi2/3系列，还有明年的第二代GPUMaxFalconShores。PonteVecchioGPUMax当年是RajaKoduri力推的项目，采用了5种不同制造工艺、47个不同模块，晶体管数量超过1000亿个，配备最多128个Xe-HPC高性能计算核心、128个光追核心、64MB一级缓存、108MB二级缓存、128GBHBM高带宽内存，满血功耗600W。Gaudi3则是独立的AI加速器，不久前刚刚发布，升级台积电5nm工艺，配备了8个矩阵引擎、64个张量核心、96MBSRAM缓存、1024-bit128GBHBM2E内存，满血功耗达900W。Intel声称，它相比上代拥有2倍的FP8AI算力、4倍的BF16AI算力、2倍的网络带宽、1.5倍的内存带宽，而对比NVIDIAH100LLM推理性能领先50％、训练时间快40％。针对中国市场，Gaudi3将提供特殊版本，功耗最高限制在450W。FalconShores最初规划融合CPU、GPU，就像AMDInstinctMI300A，但后来改为纯GPU方案，融合设计则后续再说。...PC版：https://www.cnbeta.com.tw/articles/soft/1430996.htm手机版：https://m.cnbeta.com.tw/view/1430996.htm

AMD Zen5开始行动冲上192核心、锐龙8000明年见

AMDZen5开始行动冲上192核心、锐龙8000明年见补丁文件显示，Zen5霄龙将具备12个DDR5内存通道，这和此前曝料一致，和现有Zen4Genoa、Bergamo系列是一样的。不知道下一代霄龙是否会更换接口，但考虑到要支持MR-DIMM、MCR-DIMM等内存规格，不排除会有变。按照AMD给出的官方路线图，消费级的锐龙8000系列、数据中心级的下一代霄龙，都将在2024年推出。其中，霄龙家族代号Turin，升级为4nm、3nm工艺，包含Zen5、Zen53DV-Cache、Zen5c等多个不同版本，和现有产品线一一对应。曝料称，Zen5霄龙标准版将有16个CCD、128核心、512MB三级缓存，3D缓存版集成最多1GB，加上原生512MB，三级缓存就多达1.5GB，Zen5c版本则是12个CCD、192核心、384MB三级缓存。锐龙8000还是最多16核心32线程，二三级缓存不变，一级缓存从64KB增加到80KB，IPC提升最多19％，加速频率预计可达5.8-6.0GHz，热设计功耗最高还是170W。...PC版：https://www.cnbeta.com.tw/articles/soft/1369603.htm手机版：https://m.cnbeta.com.tw/view/1369603.htm

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人