中国特供预估年销900亿 NVIDIA H20细节曝光:核心狂砍41%、性能暴跌28%

中国特供预估年销900亿 NVIDIA H20细节曝光:核心狂砍41%、性能暴跌28% 根据Geekbench 6测试数据,H20配备78组SM,而H100 GPU总共配备144组SM,不过并没有全部打开,其中SXM5版本中启用了132组SM,而PCIe 5.0版本则启用了114组SM。此外,H20配备了96GB的HBM3内存,比原始H100的80GB要高,但低于新版H100的144GB HBM3E内存;同时H20的带宽为4.0 TB/s,低于顶级H100的8.0 TB/s性能方面,NVIDIA H20的INT8为296 TFLOPS,FP16为148 TFLOPS,TF32为74 TFLOPS,FP32为44 TFLOPS,而FP64只有1 TFLOPS。在OpenCL测试中,H20的成绩为248992分,H100 80GB版本大概在280000分,如果是拥有132组SM的H100可达350000分左右,配备了144GB HBM3E的H100分数就更高了。其他方面,H20还配有60MB的L2缓存,支持7个多实例GPU,8路HGX配置,900 GB/s的NVLink带宽,TDP为400W。根据芯片行业咨询公司SemiAnalysis的预测,NVIDIA有望在当前财年交付超过100万个H20芯片,预计每个芯片售价在1.2万至1.3万美元之间。也就意味着H20芯片预估今年销售额将超过120亿美元(约合870亿元人民币),有望超过上一财年NVIDIA的中国区营收。 ... PC版: 手机版:

相关推荐

封面图片

NVIDIA官方回应H20砍单传言

NVIDIA官方回应H20砍单传言 近期,有机构对于此时采访了对于NVIDIA市场部的领导进行了访谈。具体答复如下:Q:H20组成集群的性能与Ascend 910的比较?A:服务器卡间瓶颈,服务器间瓶颈。卡间互联910的互联带宽是H20的一半,卡间互联性能下降一半。服务器间互联,NVIDIA有一分半IB交换机,没有替代解决方案。国内是400、800G集群交换机,算力损耗比较大。Q:H20的NVLINK是900GB/s,H800只是400GB/s,可以达到吗?A:NVLINK对NV不是高端的,很成熟了,H系列都可以支撑。网络带宽支撑这么大,可以买更多的卡达到,NVLINK的传输速度可以领先的。异腾达不到的,现在是400G,8卡一连就是200了。Q:近日是否有中国的订单大量砍单的情况?A:截止昨日,H20的中国订单一直稳定,市场部尚未接到大量砍单的现象。Q:请领导介绍一下H20的优势和劣势?A:NVIDIA作为全球AI芯片的领导者,无论在硬件上还是在软件生态上都是最成熟的。H20是高缓存、高带宽,但是算力性能差,这主要是禁令的要求和限制。H20卡算力性能与910相比差了一些,但是,缓存与带宽远比910高,带宽是910两倍。NV有NVLINK架构,H20可以是通过多卡使用、多卡堆叠模式,完全超越910,甚至突破H100。Q:中国市场的业务拓展情况?A:H20就是为中国推出的定制版,公司十分重视中国市场,已经启动H20的推广,委托中国国内最强的技术团队,届时,现场有千台H20组网集群,大家一定会看到非常震撼的效果。NVIDIA近况交流要点:H20:1)专供国内的训练卡,目前已确定数量在40w张左右,随着国内互联网等企业对该卡的接受度增加,有较大提升空间;2)价格下降,1月份定价为2.3-2.5w美元,2月份下降至1.2-1.4w美元,主要系910b的压力;3)单卡性能为910b的60%+,单卡算力为H100的20%;4)集群性能优越,主要受益于NVIDIA NVLINK技术。B100:1)目前市面上最高端的训练卡,性能为H100的三倍多;2)24年7月份开始小批量供应,25年起起量供应成为主力训练卡;3)按照H100算力和客户价格接受度预测在3.6-3.9w美金之间,不会超过4w美元;4)分为低算力/高算力两种,对应散热方式是风能/液冷, 占比60%液冷+ 40%风能。NVIDIA25年及以后:1)25年训练卡的总量约为500w张,推测b100/h200/h100分别为200w/100w/100w;2)23年至25年,NVIDIA训练卡将处于高峰期。预计在26年,随着AI应用广泛存在,AI服务器的增速将逐渐平缓。这一趋势将促使通用服务器逐渐摆脱AI服务器的冲击,并扭转之前的负增长态势。预计在27年,通用服务器市场将恢复正增长。格局变化:1)预计在27年,通用服务器市场将恢复正增长。2)AI服务器代工无影响,推理+训练此消彼长,总量不变;3)可能影响卡的代工厂商,训练卡25年增速放缓,其代工厂寻求其他产能合作。 ... PC版: 手机版:

封面图片

消息称英伟达“特供版”H20芯片2024年GTC大会后全面接受预订

消息称英伟达“特供版”H20芯片2024年GTC大会后全面接受预订 今年1月有消息称,英伟达已开始接受经销商预订一款新的中国专用人工智能(AI)芯片H20,这些芯片的定价与中国等竞争对手产品相当。H20显卡是英伟达为中国市场开发的三款显卡中最强大的一款。但H20的计算能力自然会低于英伟达的旗舰H100 AI芯片和此前英伟达针对中国市场的H800。据三位消息人士透露,H20的规格似乎也表明,它在某些关键领域的性能不如中国竞争对手,例如衡量芯片处理常见任务速度的FP32性能方面,但在互连速度方面H20似乎更具优势。英伟达对中国H20分销商的订单定价为每张卡12000美元~15000美元。根据此前曝光的参数信息,英伟达H20与H100、H200同系列,均采用英伟达Hopper架构,但显存容量增大至96GB HBM3,GPU显存带宽4.0TB/s。算力方面,该产品的FP8算力为296 TFLOPS,FP16算力为148 TFLOPS,仅为当今“最强”AI芯片H200的1/13。 ... PC版: 手机版:

封面图片

中国公司开始大量订购NVIDIA H20芯片

中国公司开始大量订购NVIDIA H20芯片 此前,由于美国对华出口限制的升级,加上H20芯片的性能阉割,许多中国公司转向了国产Ascend 910B芯片。然而,由于Ascend 910B芯片供应问题,以及其生产良率的传闻,英伟达H20 AI GPU重新获得了市场的关注。尽管H20在性能上不及英伟达的H100,其AI算力只有H100的不到15%,甚至部分性能不及Ascend 910B,但在国产AI芯片供应不足的情况下,中国厂商的选择显得有些无奈。尽管H20可能不是最理想的选择,但在当前的市场环境下,它提供了一个可行的解决方案,以维持公司在AI领域的竞争力。 ... PC版: 手机版:

封面图片

中国特供版英伟达 H20 AI 芯片开始接受预订

中国特供版英伟达 H20 AI 芯片开始接受预订 熟悉内情的消息人士称,英伟达已开始接受经销商预订中国特供版芯片,定价与竞争对手华为的产品持平。H20 显卡是英伟达为中国市场开发的三款显卡中最强大的一款。H20 的计算能力自然会低于英伟达的旗舰 H100 AI 芯片和 H800。 两位消息人士说,近几周,英伟达开始接受中国经销商的 H20 订单,每张显卡价格在1.2万至1.5万美元之间。其中一位消息人士称,一些经销商已开始对芯片进行大幅加价兜售,价格约为 11 万元人民币 (15,320 美元)。两位消息人士称,相比之下,华为 910B 的售价约为 12 万元人民币。

封面图片

英伟达中国特供版H20芯片据报下月接受预订

英伟达中国特供版H20芯片据报下月接受预订 中国媒体报道,美国芯片制造商英伟达专为中国市场设计的人工智能(AI)芯片H20,将从3月下旬起接受预订。不过由于性价比不高,中国经销商对H20的需求声量并不大。 据《科创板日报》星期二(2月27日)报道,该报记者从产业链人士处了解到,英伟达对华“特供版”AI芯片H20将在英伟达今年的GTC大会(GPU技术大会)闭幕后全面接受预订,最快四周可以供货。英伟达今年的GTC大会将于3月18日至21日举行。 一名产业链人士说,H20的性能相当于H100的四分之一,但性价比不太好,产能供应也跟不上,量供预计要到今年下半年。 北京一名经销商则说,目前市场上对H20的需求声量并不大,主要由于H20“性价比不高”。另外,中国国产算力芯片也是厂商的一个选择。 另一名深圳地区经销商也说,目前还不确定是否会进货H20,需要根据后续的市场需求来决定。 不过,这名深圳经销商指出,目前算力厂商的芯片底层技术多数还是由英伟达支持,采用H20的优势在于合规和迁移成本低。 H20是英伟达针对中国市场推出的“特供”版本,以符合美国的出口管制新规。H20芯片原定去年11月发布,但此后一直被推迟。 中国通讯巨头华为2019年推出的升腾系列AI芯片,被视为英伟达A100芯片的主要竞争对手。英伟达星期三(2月21日)在提交美国证券管理委员会(SEC)的文件中,在AI芯片等多个类别首次将华为列为头号竞争对手。 2024年2月28日 5:34 PM

封面图片

精准缩水的NVIDIA三款中国特供AI GPU开始小批量供货

精准缩水的NVIDIA三款中国特供AI GPU开始小批量供货 但是很快,美国出台新规,算力也做了限制,A800、H800甚至是RTX 4090就都没法卖了。为此,NVIDIA在游戏卡市场设计了RTX 4090D,已经低调上市。而在AI加速领域,NVIDIA设计了H20、L20、L2,原计划2023年就发布出货,但为了完全符合出口管制,推迟了一段时间。H20基于Hopper架构,是一款高性能的AI训练卡,正是中国客户亟需的,根据最新报道它已经开始小批量供货给中国,第二季度上量。H20的定价据称仅为1.2-1.5万美元,比华为升腾910B 1.7万美元要低不少,用心昭然若揭。L20、L2均基于Ada Lovelace架构,均为AI推理卡,暂不清楚是否已经供货,可能要稍等等,对于中国客户而言也不是非常迫切的需要。目前,三款新卡的最终规格已经确定,和之前曝光的基本一致。H20的规格还是比较强的,INT8/FP8 Tensor算力为296T,BF16/FP16 Tensor算力为148T,TF32 Tensor算力为74T,FP32算力为44T,FP64算力为1T,功耗400W。它具备60MB二级缓存、96GB HBM3内存,带宽4TB/s,支持7路NVDEC、7路NVJPEG视频引擎,还有着PCIe 5.0 x16系统接口、900GB/s NVLink互联带宽,支持最多7个MIG。相比于H200,它少了45GB HBM3,算力更是阉割得七零八落,INT8/FP8、BF16/FP16、TF32都少了多达93%,FP64少了足足97%,只有FP32至少了35%。但即便如此,H20 FP32性能依然不如华为升腾910B,这也是后者最大的优势。H20还可以八卡并行,组成一套HGX服务器,价格大约20万美元,而之前八块H800服务器需要大约28万美元。L20是双插槽全高全长PCIe扩展卡,搭载96MB二级缓存、48GB GDDR6 ECC内存,带宽864GB/s,INT8/FP8算力为239T,更高精度逐级减半,但不支持FP64,功耗275W。L2则是单插槽半高卡,只有36MB二级缓存、24GB GDDR6 ECC,带宽300GB/s,算力进一步降低INT8/FP8 193T,FP32额外砍了一半只有24.1T。 ... PC版: 手机版:

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人