Intel Gaudi 3 AI加速器可以卖给中国但挥刀砍掉一半

Intel Gaudi 3 AI加速器可以卖给中国但挥刀砍掉一半 Intel声称，它相比上代拥有2倍的FP8 AI算力、4倍的BF16 AI算力、2倍的网络功耗为600W带宽、1.5倍的内存带宽，而对比NVIDIA H100 LLM推理性能领先50％、训练时间快40％。Gaudi 3的首发版本编号HL-325L，OAM形态，已经出货，功耗900W，风冷散热。它的中国特供版将在6月份推出，编号HL-328，功耗减半至450W，HMB内存、缓存、解码器等完全保留，但既然功耗少了一半，算力差不多也会被腰斩。10月份还会有个液冷版本HL-335，支持双路并联，但不能卖给中国，也没有特供版。PCIe扩展卡形态将在9月份出货，风冷，满血版编号HL-338，，中国特供版编号HL-388，功耗又被限制在450W。通用基板形态的编号为HLB-325，但具体规格和出货时间暂时不详。说起来，NVIDIA是最早做中国特供版AI加速器的，也就是H800、A800，后来也被禁售了，最近又拿出了H20、L20、L2、RTX 4090D，都能卖。AMD也设计了特供版Instinct MI309、MI388X，但都被美政府以算力还是太强为由给打回，而年底将要升级到MI350。 ... PC版：手机版：

在Telegram中查看

相关推荐

英特尔为 Gaudi 3 AI加速器准备了中国特供版

英特尔为 Gaudi 3 AI加速器准备了中国特供版英特尔日前发布了性能优于 H100 的AI加速器 Gaudi 3 ，其强劲的性能预计无法满足美国政府对于出口芯片的监管要求。但本周，英特尔还发布了 Gaudi 3 人工智能加速器的中国版。其中 OAM 兼容夹层卡形态的中国版将在6月份推出，编号HL-328，功耗减半至450W，HMB内存、缓存、解码器等完全保留，预计算力将较常规版减半。PCIe扩展卡形态将在9月份出货，中国版编号HL-388，功耗同样减半至450W。通用基板形态的中国版编号为HLB-325，但具体规格和出货时间暂时不详。

Intel发布Gaudi 3 AI加速器：4倍性能提升、无惧1800亿参数大模型

Intel发布Gaudi 3 AI加速器：4倍性能提升、无惧1800亿参数大模型数据显示，预计到2030年，全球半导体市场规模将达1万亿美元，AI是主要推动力，不过在2023年，只有10％的企业能够成功将其AIGC项目产品化。Intel的最新解决方案，有望帮助企业应对推广AI项目时所面临的挑战，加速实现AIGC落地商用。Intel现有的Gaudi 2诞生于2022年5月，并于2023年7月正式引入中国，拥有极高的深度学习性能、效率，以及极高的性价比。它采用台积电7nm工艺制造，集成24个可编程的Tenor张量核心(TPC)、48MB SRAM缓存、21个10万兆内部互连以太网接口(ROCEv2 RDMA)、96GB HBM2E高带宽内存(总带宽2.4TB/s)、多媒体引擎等，支持PCIe 4.0 x16，最高功耗800W，可满足大规模语言模型、生成式AI模型的强算力需求。新一代的Gaudi 3面向AI训练和推理，升级为台积电5nm工艺，带来了2倍的FP8 AI算力、4倍的BF16 AI算力、2倍的网络带宽、1.5倍的内存带宽。对比NVIDIA H100，它在流行LLM上的推理性能领先50％、训练时间快40％。Gaudi 3预计可大幅缩短70亿和130亿参数Llama2模型、1750亿参数GPT-3模型的训练时间。在Llama 70亿/700亿参数、Falcon 1800亿参数大型语言模型上，Gaudi 3的推理吞吐量和能效也都非常出色。Gaudi 3提供多种灵活的形态，包括OAM兼容夹层卡、通用基板、PCIe扩展卡，满足不同应用需求。Gaudi 3提供开放的、基于社区的软件，以及行业标准以太网网络，可以灵活地从单个节点扩展到拥有数千个节点的集群、超级集群和超大集群，支持大规模的推理、微调和训练。Gaudi 3 AI加速器具备高性能、经济实用、节能、可快速部署等优点，能够充分满足复杂性、成本效益、碎片化、数据可靠性、合规性等AI应用需求。Gaudi 3将于2024年第二季度面向OEM厂商出货，包括戴尔、慧与、联想、超威等。目前，Intel Gaudi加速器的行业客户及合作伙伴有NAVER、博世(Bosch)、IBM、Ola/Krutrim、NielsenIQ、Seekr、IFF、CtrlS Group、Bharti Airtel、Landing AI、Roboflow、Infosys，等等。此外，Intel还宣布联合Anyscale、DataStax、Domino、Hugging Face、KX Systems、MariaDB、MinIO、Qdrant、RedHat、Redis、SAP、SAS、VMware、Yellowbrick、Zilliz等伙伴，共同创建一个开放平台，助力企业推动AI创新。该计划旨在开发开放的、多供应商的AIGC系统，通过RAG（检索增强生成）技术，提供一流的部署便利性、性能和价值。初始阶段，Intel将利用至强处理器、Gaudi加速器，推出AIGC流水线的参考实现，发布技术概念框架，并继续加强Intel Tiber开发者云平台基础设施的功能。 ... PC版：手机版：

1000+亿晶体管怪物 Intel GPU Max诞生一年半就被放弃

1000+亿晶体管怪物 Intel GPU Max诞生一年半就被放弃据最新曝料，Intel已经告知合作伙伴，GPU Max系列将逐步停产退市，Intel AI加速器的重点将放在Guadi 2/3系列，还有明年的第二代GPU Max Falcon Shores。Ponte Vecchio GPU Max当年是Raja Koduri力推的项目，采用了5种不同制造工艺、47个不同模块，晶体管数量超过1000亿个，配备最多128个Xe-HPC高性能计算核心、128个光追核心、64MB一级缓存、108MB二级缓存、128GB HBM高带宽内存，满血功耗600W。Gaudi 3则是独立的AI加速器，不久前刚刚发布，升级台积电5nm工艺，配备了8个矩阵引擎、64个张量核心、96MB SRAM缓存、1024-bit 128GB HBM2E内存，满血功耗达900W。Intel声称，它相比上代拥有2倍的FP8 AI算力、4倍的BF16 AI算力、2倍的网络带宽、1.5倍的内存带宽，而对比NVIDIA H100 LLM推理性能领先50％、训练时间快40％。针对中国市场，Gaudi 3将提供特殊版本，功耗最高限制在450W。Falcon Shores最初规划融合CPU、GPU，就像AMD Instinct MI300A，但后来改为纯GPU方案，融合设计则后续再说。 ... PC版：手机版：

Intel二代酷睿Ultra Lunar Lake AI算力破100万亿次

Intel二代酷睿Ultra Lunar Lake AI算力破100万亿次其中，单单是NPU单元就可以提供大约45TOPS的算力，是目前的多达四倍，自己即可满足微软定义下一代AI PC的需求。另外，Lunar Lake CPU算力大约为5TOPS，基本不变，GPU算力则是最高的约为50TOPS，提升接近1.8倍。竞品方面，高通骁龙X Elite总算力为75TOPS，是现有产品最高的，其中NPU就提供45TOPS，也就是和Lunar Lake处于同一水平。AMD的锐龙7040系列(Phoenix)总算力33TOPS，NPU算力10TOPS，锐龙8040系列(Hawk Point)作为简单升级版，总算力来到39TOPS，NPU算力提升为16TOPS。下一代的Strix Point将实现一次跨越，NPU部分算力提升3倍达到48TOPS，从而超越Lunar Lake，但是CPU、GPU部分不详，顾及整体超越100TOPS也没有太大难度，毕竟会升级到Zen5 CPU架构、RDNA3+ GPU架构。Lunar Lake已经多次曝光，目前信息显示升级到台积电3nm工艺、全新CPU/GPU架构，最多4P+4E 8核心8线程(不支持超线程)、8个Xe-LPG架构核显核心，还会整合封装内存，功耗级别8W、30W。型号命名将是酷睿Ultra 200V系列，已知一款酷睿Ultra 5 234V。 ... PC版：手机版：

NVIDIA Blackwell B200 AI加速器下季度开始出货单价是传统服务器的10倍

NVIDIA Blackwell B200 AI加速器下季度开始出货单价是传统服务器的10倍据台湾《经济日报》报道，英伟达（NVIDIA）将于2024年第三季度至第四季度"小批量"出货其下一代GB200人工智能服务器，并将于2025年第一季度开始大规模出货。另据报道，每台 Blackwell 服务器的单价将是传统服务器的 10 倍。我们之前曾报道过每块 Blackwell GPU 的价格应高达 3.5 万美元，而一组 AI 服务器的价格可能高达 300 万美元。英伟达 DGX GB200"Blackwell"AI 服务器分为三个部分：DGX NVL72、NVL32 和 HGX B200。其中配置最高的是 NVL72，配备了 72 个英伟达 Blackwell B200 AI GPU 和 Grace Hopper CPU。据悉，富士康的子公司 Fii 将在下一季度出货部分 DGX GB200"NVL72"，而该公司早在 4 月份就已向客户交付了 NVL32 对应产品，因此该公司是首批向业界出货 Blackwell 产品的公司之一。除此之外，广达等合作伙伴也有望在本季度向客户交付英伟达的 Blackwell GB200 AI 服务器。虽然两家公司还没有透露谁是"独家"买家，但我们或许对此有所了解。我们曾报道过 Meta 已经下单了基于 Blackwell 的产品，包括 B200 AI GPU 和 AI 服务器，所以这可能是大部分产能的去向。微软和 OpenAI 也对英伟达的 Blackwell 表示了兴趣。 ... PC版：手机版：

英特尔Gaudi 2-D加速器出现在新的Linux补丁中可能是中国特供版

英特尔Gaudi 2-D加速器出现在新的Linux补丁中可能是中国特供版在此之前，我们曾看到Gaudi 2-C 型号浮出水面，但我们没有收到英特尔方面确切的消息。我们所知道的英特尔新发布的唯一一款 AI 加速器是下一代Gaudi 3 AI 加速器，在 Computex 2024 上有过广泛报道，但看起来该公司可能正在计划修订型号。深入研究拉取请求，除了新的英特尔Gaudi 2-D 模型使用了与原始Gaudi 2 AI 加速器相同的代码路径这一事实之外，补丁中并没有太多关于新模型的细节，这表明"2D"变体可能是针对特定客户群的修订版。让人联想到的一点是，英特尔可能正在准备进军中国市场，正如之前报道的那样，随着这些变体的浮出水面，公司可能会决定在中国提供中低端型号，但目前还不能确定。Gaudi 2-D 肯定不是英特尔及其人工智能部门的终点。在最近的 Computex 主题演讲上，该公司对其在人工智能市场的未来表现出了极大的乐观，尤其是Gaudi系列，以及它如何提供最佳性价比的设计。虽然英特尔现在无法与英伟达的水平相提并论，但他们肯定会在价值方面积极进取，如果该公司决定利用尚未开发的中国市场，那么英伟达就会有所顾忌。 ... PC版：手机版：

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人