英特尔推出性能超越英伟达 H100 的 Gaudi 3 AI 加速芯片

英特尔推出性能超越英伟达 H100 的 Gaudi 3 AI 加速芯片 英特尔 Vision 2024 大会的第二天,英特尔正式推出了 Gaudi 3 加速芯片。Gaudi 3 使用台积电 5nm 工艺制造,热设计功耗为 900W ,FP8 精度下的峰值性能为 1835 TFLOPS。英特尔称 Gaudi 3 在 16 个芯片组成的加速集群中以 FP8 精度训练 Llama2-13B 时比性能 H100 高出 1.7 倍。同时,英特尔预计 Gaudi 3 的推理性能将比 H200/H100 提高 1.3 倍到 1.5 倍,能效比将高 2.3 倍。英特尔已经向客户提供了样片,并将在第三季度正式批量交付。

相关推荐

封面图片

英特尔 推定制版 AI 芯片,中国客户会买单吗?

英特尔 推定制版 AI 芯片,中国客户会买单吗? 根据英特尔提供的信息,Gaudi2 的性能低于 Nvidia H100,但高于 A100。针对和H100的差距,英特尔认为,Gaudi2的优势在于性价比。 某AI模型层创企的CTO表示,目前存在顾虑。“在训练100亿参数规模模型10轮情况下,其他公司的芯片训练速度,普遍比A100多出10几天,宁愿多花钱买点A100或H100,也不想耽误训练的时间。且Gaudi2在2022年已经发布,市场的选择已经说明问题。” #阅读材料 #观点

封面图片

【英特尔发布新款AI芯片,希望从英伟达和AMD争抢市场份额】

【英特尔发布新款AI芯片,希望从英伟达和AMD争抢市场份额】 英特尔发布新款AI芯片Xeon 6,紧追英伟达和AMD最近两天先后推出新款AI芯片的步伐。 据了解,英特尔Xeon 6在高强度数据中心工作载荷的性能和电源效率都优于旧款芯片。 英特尔宣布,Gaudi 2 和Gaudi 3 AI加速器的价格低于众多竞争对手的AI芯片产品。 六个月之前,英特尔推出了针对数据中心工作量的第五代Intel Xeon processors,在那两个月之后,发布用于AI模型训练和开发的Gaudi 3处理器。

封面图片

性能暴降92%:英特尔中国特供AI芯片曝光

性能暴降92%:英特尔中国特供AI芯片曝光 英特尔在其Gaudi 3 AI芯片白皮书中披露,正准备向中国市场推出“特供版”Gaudi 3。中国特供Gaudi 3包括名为HL-328的OAM兼容夹层卡(Mezzanine Card),和名为HL-388的PCle加速卡两种,其中HL-328将于6月24日推出,HL-388将于9月24日推出。 与原版相比,中国特供版Gaudi 3拥有相同的96MB SRAM片上内存, 128GB HBM2e高带宽内存,带宽为3.7TB/s,拥有PCIe 5.0 x16接口和解码标准。但是由于美国对于AI芯片的出口管制,其综合运算性能(TPP)需要低于4800才能出口到中国, 这也意味中国特供版Gaudi 3的16bit性能不能超过150 TFLOPS。 而原版Gaudi 3在FP16/BF16上的性能可以达到1835 TFLOPS,因此中国特供版Gaudi 3最终可能需要将其AI性能降低约92%,才能符合美国的出口管制要求。 频道:@kejiqu 群组:@kejiquchat

封面图片

英特尔正式推出至强6系列处理器 力图赶超英伟达

英特尔正式推出至强6系列处理器 力图赶超英伟达 英特尔展示了其新一代至强数据中心处理器,首次启用全新的命名方式“至强6(Xeon 6)”,将从现在到明年一季度分批次陆续登场。至强6系列分为E和P系列。其中,P系列主要针对高性能计算、数据库与分析、人工智能、网络、边缘和基础设施/存储等计算密集型和AI工作负载,最多配备128个性能核心,包括6900P/6700P/6500P/6300P等。E系列主要面向高密度、可扩展负载等,优化应用的效率表现,最多配备288个核心,包括6700E/6900E处理器。据悉,“至强6”系列处理器虽然没有采用消费端的P核+E核的异构架构设计,但彼此共享硬件平台、软件开发堆栈。新的至强6系列处理器拥有更高效的内核,可以让数据中心运营商将特定任务所需的空间减少到上一代硬件的三分之一。另外,与AMD(AMD.US)、高通(QCOM.US)等竞争对手一样,英特尔也吹嘘其新的系列处理器的性能明显好于现有产品。与此同时,英特尔正式发布了Lunar Lake笔记本处理器,用于下一代AI PC,号称相比上一代产品AI性能提升3倍。英特尔还推出了AI PC开发套件,搭载Lunar Lake处理器、32GB LPDDR5内存、512GB存储。英特尔表示,AI PC开发套件后续可以升级到Panther Lake芯片(预计明年推出)。英伟达首席执行官黄仁勋曾表示,在人工智能时代,英特尔等传统处理器正在失去动力。但Pat Gelsinger表示,作为领先的个人电脑芯片制造商,英特尔将在人工智能的扩张中发挥重要作用。在AI加速器方面,英特尔表示,包含八块AI芯片的Gaudi 3加速器套件售价大约为12.5万美元,相较于上一代Gaudi 2的6.5万美元标价有所上升;该系统将由戴尔科技(DELL.US)和Inventec Corp.等合作伙伴提供。不过,英特尔还强调,与竞争对手的产品相比,其价格仍然具有显著优势。根据供应商Thinkmate的估算,配备八个英伟达 H100 AI芯片的同类服务器系统成本可能超过30万美元。据悉,英特尔表示,相比英伟达 H100,Gaudi 3的人工智能推理性能平均提高50%,能效平均提高40%。基准测试中,Gaudi 3可以在Llama2-7B、Llama2-13B模型中将训练时间缩短到英伟达 H100 的一半,同时推理吞吐量也比后者平均高出了50%。不过,英特尔Gaudi 3的这些优势可能不足以推翻英伟达在数据中心处理器领域的领先地位。neXt Curve分析师Leonard Lee表示:“单个加速器的性能不再是最重要的事情。英伟达最大的优势在于它拥有一个有凝聚力的集成生态系统,以及像NVLink这样的专有技术,可以确保其计算集群作为一个整体运行。它的力量在于能够创造一个巨大的逻辑加速器。”由于落后于竞争对手,英特尔的收入在过去两年中有所下滑。三年前,为了扭转颓势,Pat Gelsinger重回英特尔,并斥巨资振兴公司产品、建立了一个工厂网络。Pat Gelsinger表示,这将重新夺回英特尔在芯片设计和制造领域的领先地位。尽管英特尔的销售额已经停止萎缩,但分析师并不认为会迅速反弹,且该公司到2024年底的年度收入将比2021年减少200亿美元。与此同时,据估计,英伟达的销售额将翻一番、AMD的销售额增长率将超过10%,因为这两家公司将更好地利用企业在人工智能计算硬件上的大规模支出。 ... PC版: 手机版:

封面图片

AMD 正式发布 MI300 加速器,性能较英伟达 H100 芯片提高 60%

AMD 正式发布 MI300 加速器,性能较英伟达 H100 芯片提高 60% 在美国加州圣何塞举行的 AI 特别活动中,AMD 宣布正式推出其旗舰 AI GPU 加速器 MI300X,并称其性能比英伟达的 H100 芯片提高了 60%。 据 AMD 介绍,新芯片为性能最高的芯片,拥有超过 1500 亿个晶体管。与英伟达 H100 芯片相比,AMD 新芯片的内存为其 2.4 倍,内存带宽为其 1.6 倍,训练性能与 H100 芯片相当,在运行 AI 模型方面则比英伟达快得多。 、

封面图片

英特尔为 Gaudi 3 AI加速器准备了中国特供版

英特尔为 Gaudi 3 AI加速器准备了中国特供版 英特尔日前发布了性能优于 H100 的AI加速器 Gaudi 3 ,其强劲的性能预计无法满足美国政府对于出口芯片的监管要求。但本周,英特尔还发布了 Gaudi 3 人工智能加速器的中国版。 其中 OAM 兼容夹层卡形态的中国版将在6月份推出,编号HL-328,功耗减半至450W,HMB内存、缓存、解码器等完全保留,预计算力将较常规版减半。PCIe扩展卡形态将在9月份出货,中国版编号HL-388,功耗同样减半至450W。通用基板形态的中国版编号为HLB-325,但具体规格和出货时间暂时不详。

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人