性能暴降92%:英特尔中国特供AI芯片曝光

性能暴降92%:英特尔中国特供AI芯片曝光 英特尔在其Gaudi 3 AI芯片白皮书中披露,正准备向中国市场推出“特供版”Gaudi 3。中国特供Gaudi 3包括名为HL-328的OAM兼容夹层卡(Mezzanine Card),和名为HL-388的PCle加速卡两种,其中HL-328将于6月24日推出,HL-388将于9月24日推出。 与原版相比,中国特供版Gaudi 3拥有相同的96MB SRAM片上内存, 128GB HBM2e高带宽内存,带宽为3.7TB/s,拥有PCIe 5.0 x16接口和解码标准。但是由于美国对于AI芯片的出口管制,其综合运算性能(TPP)需要低于4800才能出口到中国, 这也意味中国特供版Gaudi 3的16bit性能不能超过150 TFLOPS。 而原版Gaudi 3在FP16/BF16上的性能可以达到1835 TFLOPS,因此中国特供版Gaudi 3最终可能需要将其AI性能降低约92%,才能符合美国的出口管制要求。 频道:@kejiqu 群组:@kejiquchat

相关推荐

封面图片

英特尔为 Gaudi 3 AI加速器准备了中国特供版

英特尔为 Gaudi 3 AI加速器准备了中国特供版 英特尔日前发布了性能优于 H100 的AI加速器 Gaudi 3 ,其强劲的性能预计无法满足美国政府对于出口芯片的监管要求。但本周,英特尔还发布了 Gaudi 3 人工智能加速器的中国版。 其中 OAM 兼容夹层卡形态的中国版将在6月份推出,编号HL-328,功耗减半至450W,HMB内存、缓存、解码器等完全保留,预计算力将较常规版减半。PCIe扩展卡形态将在9月份出货,中国版编号HL-388,功耗同样减半至450W。通用基板形态的中国版编号为HLB-325,但具体规格和出货时间暂时不详。

封面图片

英特尔推出性能超越英伟达 H100 的 Gaudi 3 AI 加速芯片

英特尔推出性能超越英伟达 H100 的 Gaudi 3 AI 加速芯片 英特尔 Vision 2024 大会的第二天,英特尔正式推出了 Gaudi 3 加速芯片。Gaudi 3 使用台积电 5nm 工艺制造,热设计功耗为 900W ,FP8 精度下的峰值性能为 1835 TFLOPS。英特尔称 Gaudi 3 在 16 个芯片组成的加速集群中以 FP8 精度训练 Llama2-13B 时比性能 H100 高出 1.7 倍。同时,英特尔预计 Gaudi 3 的推理性能将比 H200/H100 提高 1.3 倍到 1.5 倍,能效比将高 2.3 倍。英特尔已经向客户提供了样片,并将在第三季度正式批量交付。

封面图片

英特尔 推定制版 AI 芯片,中国客户会买单吗?

英特尔 推定制版 AI 芯片,中国客户会买单吗? 根据英特尔提供的信息,Gaudi2 的性能低于 Nvidia H100,但高于 A100。针对和H100的差距,英特尔认为,Gaudi2的优势在于性价比。 某AI模型层创企的CTO表示,目前存在顾虑。“在训练100亿参数规模模型10轮情况下,其他公司的芯片训练速度,普遍比A100多出10几天,宁愿多花钱买点A100或H100,也不想耽误训练的时间。且Gaudi2在2022年已经发布,市场的选择已经说明问题。” #阅读材料 #观点

封面图片

中国特供版英伟达 H20 AI 芯片开始接受预订

中国特供版英伟达 H20 AI 芯片开始接受预订 熟悉内情的消息人士称,英伟达已开始接受经销商预订中国特供版芯片,定价与竞争对手华为的产品持平。H20 显卡是英伟达为中国市场开发的三款显卡中最强大的一款。H20 的计算能力自然会低于英伟达的旗舰 H100 AI 芯片和 H800。 两位消息人士说,近几周,英伟达开始接受中国经销商的 H20 订单,每张显卡价格在1.2万至1.5万美元之间。其中一位消息人士称,一些经销商已开始对芯片进行大幅加价兜售,价格约为 11 万元人民币 (15,320 美元)。两位消息人士称,相比之下,华为 910B 的售价约为 12 万元人民币。

封面图片

中国特供预估年销900亿 NVIDIA H20细节曝光:核心狂砍41%、性能暴跌28%

中国特供预估年销900亿 NVIDIA H20细节曝光:核心狂砍41%、性能暴跌28% 根据Geekbench 6测试数据,H20配备78组SM,而H100 GPU总共配备144组SM,不过并没有全部打开,其中SXM5版本中启用了132组SM,而PCIe 5.0版本则启用了114组SM。此外,H20配备了96GB的HBM3内存,比原始H100的80GB要高,但低于新版H100的144GB HBM3E内存;同时H20的带宽为4.0 TB/s,低于顶级H100的8.0 TB/s性能方面,NVIDIA H20的INT8为296 TFLOPS,FP16为148 TFLOPS,TF32为74 TFLOPS,FP32为44 TFLOPS,而FP64只有1 TFLOPS。在OpenCL测试中,H20的成绩为248992分,H100 80GB版本大概在280000分,如果是拥有132组SM的H100可达350000分左右,配备了144GB HBM3E的H100分数就更高了。其他方面,H20还配有60MB的L2缓存,支持7个多实例GPU,8路HGX配置,900 GB/s的NVLink带宽,TDP为400W。根据芯片行业咨询公司SemiAnalysis的预测,NVIDIA有望在当前财年交付超过100万个H20芯片,预计每个芯片售价在1.2万至1.3万美元之间。也就意味着H20芯片预估今年销售额将超过120亿美元(约合870亿元人民币),有望超过上一财年NVIDIA的中国区营收。 ... PC版: 手机版:

封面图片

英特尔Gaudi 2-D加速器出现在新的Linux补丁中 可能是中国特供版

英特尔Gaudi 2-D加速器出现在新的Linux补丁中 可能是中国特供版 在此之前,我们曾看到Gaudi 2-C 型号浮出水面,但我们没有收到英特尔方面确切的消息。我们所知道的英特尔新发布的唯一一款 AI 加速器是下一代Gaudi 3 AI 加速器,在 Computex 2024 上有过广泛报道,但看起来该公司可能正在计划修订型号。深入研究拉取请求,除了新的英特尔Gaudi 2-D 模型使用了与原始Gaudi 2 AI 加速器相同的代码路径这一事实之外,补丁中并没有太多关于新模型的细节,这表明"2D"变体可能是针对特定客户群的修订版。让人联想到的一点是,英特尔可能正在准备进军中国市场,正如之前报道的那样,随着这些变体的浮出水面,公司可能会决定在中国提供中低端型号,但目前还不能确定。Gaudi 2-D 肯定不是英特尔及其人工智能部门的终点。在最近的 Computex 主题演讲上,该公司对其在人工智能市场的未来表现出了极大的乐观,尤其是Gaudi系列,以及它如何提供最佳性价比的设计。虽然英特尔现在无法与英伟达的水平相提并论,但他们肯定会在价值方面积极进取,如果该公司决定利用尚未开发的中国市场,那么英伟达就会有所顾忌。 ... PC版: 手机版:

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人