英特尔已结束Ponte Vecchio的部署 将专注于Gaudi 2/3和Falcon Shores

英特尔已结束Ponte Vecchio的部署 将专注于Gaudi 2/3和Falcon Shores 据Serve The Home报道,英特尔已经结束了Ponte Vecchio的部署,未来不会有更多的集群,只会在现有使用Ponte Vecchio的系统中继续提供。英特尔已经将注意力转移到Gaudi 2/3和Falcon Shores身上,预计会在2025年上市。Xe系列架构对英特尔来说仍然很重要,接下来会继续开发配套的软件,以支持明年的新品。Ponte Vecchio是英特尔首个百亿亿次级计算GPU,使用了英特尔有史以来最先进的封装技术,拥有超过1000亿个晶体管,由47个被称为“魔术贴”的芯片组成,是当时英特尔先进技术的集大成者。其总共有63个模块,除了16个Xe-HPG架构的计算芯片、8个Rambo cache芯片、2个Xe基础芯片、11个EMIB连接芯片、2个Xe Link I/O芯片和8个HBM芯片以外,还有16个用于TDP输出,通过EMIB与Foveros 3D封装中整合在一起。2022年末,英特尔推出了MAX系列CPU和GPU,分别基于代号Sapphire Rapids-HBM和Ponte Vecchio的芯片构建。这是英特尔面向高性能计算(HPC)和人工智能(AI)的产品线,为美国能源部阿贡国家实验室的Aurora超级计算机提供动力。近日公布的第63期全球超算Top500榜单中,Aurora排在了第二名,运算性能达到了1.012 Exaflop/s。 ... PC版: 手机版:

相关推荐

封面图片

英特尔下一代Falcon Shores GPU的TDP高达1500W 一开始就不考虑设计风冷

英特尔下一代Falcon Shores GPU的TDP高达1500W 一开始就不考虑设计风冷 访问:NordVPN 立减 75% + 外加 3 个月时长 另有NordPass密码管理器 Grace、Blackwell合体的GB200最高可达2700W,不过人家是两颗GPU加一颗CPU。AMD最新的Instinct MI350X最高功耗为750W,Intel自己的Gaudi 3则是最高900W。Intel刚刚确认将迅速放弃代号Ponte Vecchio的第一代GPU Max加速卡,后续推广重点转向Gaudi 2/3独立加速器,以及这个Falcon Shores。Falcon Shores最初的规划是同时集成x86 CPU、Xe GPU,就像AMD Instinct MI300A那样打造成融合式APU,后者整合了24个Zen4 CPU核心、CDNA3 GPU核心。可惜,因为软硬件设计难度都太大,Intel暂时放弃了这种方案,Falcon Shores回归纯GPU方案,预计明年发布,还是叫做GPU Max。据说,Falcon Shore交给了Gaudi团队操刀设计。 ... PC版: 手机版:

封面图片

英特尔"Aurora"突破Exaflops障碍 成为AI领域速度最快的超级计算机

英特尔"Aurora"突破Exaflops障碍 成为AI领域速度最快的超级计算机 由英特尔、阿贡国家实验室(Argonne National Laboratory)和HPE合作研发的Aurora超级计算机以585.34 petaflops的部分系统运行速度排名第二。阿贡的早期科学计划取得了重大进展,该计划重点关注科学研究中的高性能计算和人工智能应用。图为安装团队成员在阿贡国家实验室的众多机架中穿行。(图片来源:阿贡国家实验室)Aurora超级计算机部署在阿贡国家实验室,由惠普企业公司(HPE)合作建造,有望成为高性能计算和人工智能领域表现最出色的产品之一。该平台由英特尔至强 CPU Max 和数据中心 GPU Max 系列提供支持,与AMD 展开了激烈的竞争,后者成功地率先突破了Exaflops关卡。与此同时,尽管早在 2019 年就宣布了 Aurora 超级计算机,但它几乎没能达到预期目标,但如今,该系统的运行能力已达到 87%,即总共 9234 个节点。在规格方面,Aurora 超级计算机由 166 个机架组成,其中包括 10624 个刀片服务器、21248 个英特尔至强 CPU Max 芯片(第四代)和 63744 个英特尔数据中心 GPU Max 系列单元(Ponte Vecchio)。它基于 HPE slingshot 光纤架构进行互连,使用 84992 个端点。在性能指标方面,Aurora 超级计算机在 HPL LINPACK 基准测试中名列第二,但仅用了总节点容量的 87%(9234 个节点对 10624 个节点)就达到了 1.012 exaflops,成功突破了1 Exaflops障碍。在 HPCG 测试中,该系统也以 5612 TFLOPs/second 的成绩排名第三,仅使用了系统的 39%。利用 Xe 核心架构及其多个人工智能硬件模块,曙光超级计算机目前在人工智能性能排行榜上名列第一,额定总性能为 10.6 AI Exaflops。该性能使用 LINPACK 混合精度(HPL-MxP)基准进行测量。采用英特尔至强CPU Max系列和英特尔数据中心GPU Max系列技术部署的新型超级计算机彰显了英特尔推进高性能计算和人工智能的目标。这些系统包括欧洲-地中海气候变化中心(CMCC)的Cassandra,用于加速气候变化建模;意大利国家新技术、能源和可持续经济发展局(ENEA)的CRESCO 8,用于实现核聚变能源的突破;德克萨斯高级计算中心 (TACC),该中心已全面投入使用,可对超音速湍流进行生物数据分析,并对多种材料进行原子模拟;以及英国原子能管理局 (UKAEA),用于解决未来核聚变发电厂设计中的内存约束问题。混合精度人工智能基准测试的结果将为英特尔面向人工智能和高性能计算的下一代 GPU(代号为 Falcon Shores)奠定基础。Falcon Shores将利用下一代英特尔Xe架构和英特尔高迪的最佳性能。这种集成实现了统一的编程接口。英特尔至强6的早期性能结果显示,与上一代产品相比, 配备P核和多路复用器组合级(MCR)内存(8800 MT/s)的实际高性能计算应用(如欧洲海洋建模核心(NEMO))的性能提高了2.3倍,为成为高性能计算解决方案的首选主机CPU奠定了坚实的基础。 ... PC版: 手机版:

封面图片

【英特尔发布新款AI芯片,希望从英伟达和AMD争抢市场份额】

【英特尔发布新款AI芯片,希望从英伟达和AMD争抢市场份额】 英特尔发布新款AI芯片Xeon 6,紧追英伟达和AMD最近两天先后推出新款AI芯片的步伐。 据了解,英特尔Xeon 6在高强度数据中心工作载荷的性能和电源效率都优于旧款芯片。 英特尔宣布,Gaudi 2 和Gaudi 3 AI加速器的价格低于众多竞争对手的AI芯片产品。 六个月之前,英特尔推出了针对数据中心工作量的第五代Intel Xeon processors,在那两个月之后,发布用于AI模型训练和开发的Gaudi 3处理器。

封面图片

英特尔CEO确认台积电先进工艺将助力生产Arrow Lake和Lunar Lake处理器

英特尔CEO确认台积电先进工艺将助力生产Arrow Lake和Lunar Lake处理器 在会议期间,英特尔首席执行官 Pat Gelsinger表示,英特尔一直与台积电合作进行 CPU 设计,并确认下一代 CPU(如 Arrow Lake 和 Lunar Lake)将从 5 纳米节点推进到 3 纳米节点,其中Arrow Lake将采用台积电 N3 节点,Lunar Lake将采用3B 节点,从而正式迎来外界期待多年的英特尔笔记本平台。英特尔 Arrow Lake CPU 将是该公司今年晚些时候推出的重要产品,采用英特尔自己的 20A 工艺节点。之前的细节已经指出,GPU 芯片将采用台积电的 3 纳米(N3)工艺节点。虽然 GPU 芯片采用了与 Meteor Lake 相同的 iGPU 架构,又称 Alchemist"Xe-LPG",但将以Xe-LPG+ 架构的形式针对移动阵容进行某些优化。此外,从 N5 到 N3 的转变将在效率和性能方面带来不错的提升。与此同时,英特尔的 Lunar Lake CPU 预计将采用相同的 P-Core (Lion Cove)和全新的 E-Core (Skymont)核心架构,预计将在 20A 节点上制造。但这可能也仅限于 CPU 芯片。由于 Lunar Lake 放弃了 Alchemist 核心,转而采用代号为 Battlemage"Xe2-LPG"的下一代图形架构,因此 GPU 芯片将比 Meteor Lake 和 Arrow Lake CPU 有重大升级。据悉,英特尔将采用台积电的 N3B 工艺节点来生产 Lunar Lake GPU 芯片。归纳总结一下就是:英特尔 Arrow Lake:20A(CPU 芯片)/台积电 N3(GPU 芯片)英特尔 Lunar Lake:20A? (CPU芯片)/ TSMC N3B(GPU芯片)不仅如此,已经有报道称,英特尔未来代号为Nova Lake 的客户端 CPU也将采用台积电的先进工艺节点。Nova Lake CPU 预计将采用 2nm 节点,但如果某块芯片或整个芯片将采用 N2 节点制造,则会采用 2nm 节点。尽管英特尔承诺在 5 年内实现 4 个节点的工艺技术跨越,但在满足客户 CPU 的供应需求方面,英特尔对台积电表现出了强烈的依赖性。在 IFS Direct 2024 大会上,英特尔将其代工服务更名为英特尔代工服务(Intel Foundry),并增加了一个新的 14A 节点以及现有节点的几个子型号。英特尔的独立 GPU 系列已经使用了台积电的 N6 工艺节点,预计今年晚些时候推出的 Battlemage 独立阵容也将继续使用该节点。 ... PC版: 手机版:

封面图片

英特尔 推定制版 AI 芯片,中国客户会买单吗?

英特尔 推定制版 AI 芯片,中国客户会买单吗? 根据英特尔提供的信息,Gaudi2 的性能低于 Nvidia H100,但高于 A100。针对和H100的差距,英特尔认为,Gaudi2的优势在于性价比。 某AI模型层创企的CTO表示,目前存在顾虑。“在训练100亿参数规模模型10轮情况下,其他公司的芯片训练速度,普遍比A100多出10几天,宁愿多花钱买点A100或H100,也不想耽误训练的时间。且Gaudi2在2022年已经发布,市场的选择已经说明问题。” #阅读材料 #观点

封面图片

英特尔为 Gaudi 3 AI加速器准备了中国特供版

英特尔为 Gaudi 3 AI加速器准备了中国特供版 英特尔日前发布了性能优于 H100 的AI加速器 Gaudi 3 ,其强劲的性能预计无法满足美国政府对于出口芯片的监管要求。但本周,英特尔还发布了 Gaudi 3 人工智能加速器的中国版。 其中 OAM 兼容夹层卡形态的中国版将在6月份推出,编号HL-328,功耗减半至450W,HMB内存、缓存、解码器等完全保留,预计算力将较常规版减半。PCIe扩展卡形态将在9月份出货,中国版编号HL-388,功耗同样减半至450W。通用基板形态的中国版编号为HLB-325,但具体规格和出货时间暂时不详。

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人