英特尔为 Gaudi 3 AI加速器准备了中国特供版

英特尔为 Gaudi 3 AI加速器准备了中国特供版 英特尔日前发布了性能优于 H100 的AI加速器 Gaudi 3 ,其强劲的性能预计无法满足美国政府对于出口芯片的监管要求。但本周,英特尔还发布了 Gaudi 3 人工智能加速器的中国版。 其中 OAM 兼容夹层卡形态的中国版将在6月份推出,编号HL-328,功耗减半至450W,HMB内存、缓存、解码器等完全保留,预计算力将较常规版减半。PCIe扩展卡形态将在9月份出货,中国版编号HL-388,功耗同样减半至450W。通用基板形态的中国版编号为HLB-325,但具体规格和出货时间暂时不详。

相关推荐

封面图片

英特尔Gaudi 2-D加速器出现在新的Linux补丁中 可能是中国特供版

英特尔Gaudi 2-D加速器出现在新的Linux补丁中 可能是中国特供版 在此之前,我们曾看到Gaudi 2-C 型号浮出水面,但我们没有收到英特尔方面确切的消息。我们所知道的英特尔新发布的唯一一款 AI 加速器是下一代Gaudi 3 AI 加速器,在 Computex 2024 上有过广泛报道,但看起来该公司可能正在计划修订型号。深入研究拉取请求,除了新的英特尔Gaudi 2-D 模型使用了与原始Gaudi 2 AI 加速器相同的代码路径这一事实之外,补丁中并没有太多关于新模型的细节,这表明"2D"变体可能是针对特定客户群的修订版。让人联想到的一点是,英特尔可能正在准备进军中国市场,正如之前报道的那样,随着这些变体的浮出水面,公司可能会决定在中国提供中低端型号,但目前还不能确定。Gaudi 2-D 肯定不是英特尔及其人工智能部门的终点。在最近的 Computex 主题演讲上,该公司对其在人工智能市场的未来表现出了极大的乐观,尤其是Gaudi系列,以及它如何提供最佳性价比的设计。虽然英特尔现在无法与英伟达的水平相提并论,但他们肯定会在价值方面积极进取,如果该公司决定利用尚未开发的中国市场,那么英伟达就会有所顾忌。 ... PC版: 手机版:

封面图片

Intel Gaudi 3 AI加速器可以卖给中国 但挥刀砍掉一半

Intel Gaudi 3 AI加速器可以卖给中国 但挥刀砍掉一半 Intel声称,它相比上代拥有2倍的FP8 AI算力、4倍的BF16 AI算力、2倍的网络功耗为600W带宽、1.5倍的内存带宽,而对比NVIDIA H100 LLM推理性能领先50%、训练时间快40%。Gaudi 3的首发版本编号HL-325L,OAM形态,已经出货,功耗900W,风冷散热。它的中国特供版将在6月份推出,编号HL-328,功耗减半至450W,HMB内存、缓存、解码器等完全保留,但既然功耗少了一半,算力差不多也会被腰斩。10月份还会有个液冷版本HL-335,支持双路并联,但不能卖给中国,也没有特供版。PCIe扩展卡形态将在9月份出货,风冷,满血版编号HL-338,,中国特供版编号HL-388,功耗又被限制在450W。通用基板形态的编号为HLB-325,但具体规格和出货时间暂时不详。说起来,NVIDIA是最早做中国特供版AI加速器的,也就是H800、A800,后来也被禁售了,最近又拿出了H20、L20、L2、RTX 4090D,都能卖。AMD也设计了特供版Instinct MI309、MI388X,但都被美政府以算力还是太强为由给打回,而年底将要升级到MI350。 ... PC版: 手机版:

封面图片

性能暴降92%:英特尔中国特供AI芯片曝光

性能暴降92%:英特尔中国特供AI芯片曝光 英特尔在其Gaudi 3 AI芯片白皮书中披露,正准备向中国市场推出“特供版”Gaudi 3。中国特供Gaudi 3包括名为HL-328的OAM兼容夹层卡(Mezzanine Card),和名为HL-388的PCle加速卡两种,其中HL-328将于6月24日推出,HL-388将于9月24日推出。 与原版相比,中国特供版Gaudi 3拥有相同的96MB SRAM片上内存, 128GB HBM2e高带宽内存,带宽为3.7TB/s,拥有PCIe 5.0 x16接口和解码标准。但是由于美国对于AI芯片的出口管制,其综合运算性能(TPP)需要低于4800才能出口到中国, 这也意味中国特供版Gaudi 3的16bit性能不能超过150 TFLOPS。 而原版Gaudi 3在FP16/BF16上的性能可以达到1835 TFLOPS,因此中国特供版Gaudi 3最终可能需要将其AI性能降低约92%,才能符合美国的出口管制要求。 频道:@kejiqu 群组:@kejiquchat

封面图片

英特尔面向中国市场推出全新 Gaudi2 处理器:总内存带宽 2.4TB / s、用于训练 AI

英特尔面向中国市场推出全新 Gaudi2 处理器:总内存带宽 2.4TB / s、用于训练 AI 英特尔 Gaudi2 处理器的架构重点在于高效扩展,以满足大规模语言模型及生成式 AI 模型的需求;该处理器的每张芯片集成了 21 个专用于内部互联的 100Gbps 以太网接口。 在 Stable Diffusion 训练上,英特尔 Gaudi2 处理器展示了从 1 张卡至 64 张卡近线性 99% 的扩展性,从 256 个加速器到 384 个加速器可实现接近线性的 95% 扩展效果 ========= 你这个性能有美国商务部认证

封面图片

【英特尔发布新款AI芯片,希望从英伟达和AMD争抢市场份额】

【英特尔发布新款AI芯片,希望从英伟达和AMD争抢市场份额】 英特尔发布新款AI芯片Xeon 6,紧追英伟达和AMD最近两天先后推出新款AI芯片的步伐。 据了解,英特尔Xeon 6在高强度数据中心工作载荷的性能和电源效率都优于旧款芯片。 英特尔宣布,Gaudi 2 和Gaudi 3 AI加速器的价格低于众多竞争对手的AI芯片产品。 六个月之前,英特尔推出了针对数据中心工作量的第五代Intel Xeon processors,在那两个月之后,发布用于AI模型训练和开发的Gaudi 3处理器。

封面图片

英特尔正式推出至强6系列处理器 力图赶超英伟达

英特尔正式推出至强6系列处理器 力图赶超英伟达 英特尔展示了其新一代至强数据中心处理器,首次启用全新的命名方式“至强6(Xeon 6)”,将从现在到明年一季度分批次陆续登场。至强6系列分为E和P系列。其中,P系列主要针对高性能计算、数据库与分析、人工智能、网络、边缘和基础设施/存储等计算密集型和AI工作负载,最多配备128个性能核心,包括6900P/6700P/6500P/6300P等。E系列主要面向高密度、可扩展负载等,优化应用的效率表现,最多配备288个核心,包括6700E/6900E处理器。据悉,“至强6”系列处理器虽然没有采用消费端的P核+E核的异构架构设计,但彼此共享硬件平台、软件开发堆栈。新的至强6系列处理器拥有更高效的内核,可以让数据中心运营商将特定任务所需的空间减少到上一代硬件的三分之一。另外,与AMD(AMD.US)、高通(QCOM.US)等竞争对手一样,英特尔也吹嘘其新的系列处理器的性能明显好于现有产品。与此同时,英特尔正式发布了Lunar Lake笔记本处理器,用于下一代AI PC,号称相比上一代产品AI性能提升3倍。英特尔还推出了AI PC开发套件,搭载Lunar Lake处理器、32GB LPDDR5内存、512GB存储。英特尔表示,AI PC开发套件后续可以升级到Panther Lake芯片(预计明年推出)。英伟达首席执行官黄仁勋曾表示,在人工智能时代,英特尔等传统处理器正在失去动力。但Pat Gelsinger表示,作为领先的个人电脑芯片制造商,英特尔将在人工智能的扩张中发挥重要作用。在AI加速器方面,英特尔表示,包含八块AI芯片的Gaudi 3加速器套件售价大约为12.5万美元,相较于上一代Gaudi 2的6.5万美元标价有所上升;该系统将由戴尔科技(DELL.US)和Inventec Corp.等合作伙伴提供。不过,英特尔还强调,与竞争对手的产品相比,其价格仍然具有显著优势。根据供应商Thinkmate的估算,配备八个英伟达 H100 AI芯片的同类服务器系统成本可能超过30万美元。据悉,英特尔表示,相比英伟达 H100,Gaudi 3的人工智能推理性能平均提高50%,能效平均提高40%。基准测试中,Gaudi 3可以在Llama2-7B、Llama2-13B模型中将训练时间缩短到英伟达 H100 的一半,同时推理吞吐量也比后者平均高出了50%。不过,英特尔Gaudi 3的这些优势可能不足以推翻英伟达在数据中心处理器领域的领先地位。neXt Curve分析师Leonard Lee表示:“单个加速器的性能不再是最重要的事情。英伟达最大的优势在于它拥有一个有凝聚力的集成生态系统,以及像NVLink这样的专有技术,可以确保其计算集群作为一个整体运行。它的力量在于能够创造一个巨大的逻辑加速器。”由于落后于竞争对手,英特尔的收入在过去两年中有所下滑。三年前,为了扭转颓势,Pat Gelsinger重回英特尔,并斥巨资振兴公司产品、建立了一个工厂网络。Pat Gelsinger表示,这将重新夺回英特尔在芯片设计和制造领域的领先地位。尽管英特尔的销售额已经停止萎缩,但分析师并不认为会迅速反弹,且该公司到2024年底的年度收入将比2021年减少200亿美元。与此同时,据估计,英伟达的销售额将翻一番、AMD的销售额增长率将超过10%,因为这两家公司将更好地利用企业在人工智能计算硬件上的大规模支出。 ... PC版: 手机版:

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人