英特尔Gaudi 2-D加速器出现在新的Linux补丁中 可能是中国特供版

英特尔Gaudi 2-D加速器出现在新的Linux补丁中 可能是中国特供版 在此之前,我们曾看到Gaudi 2-C 型号浮出水面,但我们没有收到英特尔方面确切的消息。我们所知道的英特尔新发布的唯一一款 AI 加速器是下一代Gaudi 3 AI 加速器,在 Computex 2024 上有过广泛报道,但看起来该公司可能正在计划修订型号。深入研究拉取请求,除了新的英特尔Gaudi 2-D 模型使用了与原始Gaudi 2 AI 加速器相同的代码路径这一事实之外,补丁中并没有太多关于新模型的细节,这表明"2D"变体可能是针对特定客户群的修订版。让人联想到的一点是,英特尔可能正在准备进军中国市场,正如之前报道的那样,随着这些变体的浮出水面,公司可能会决定在中国提供中低端型号,但目前还不能确定。Gaudi 2-D 肯定不是英特尔及其人工智能部门的终点。在最近的 Computex 主题演讲上,该公司对其在人工智能市场的未来表现出了极大的乐观,尤其是Gaudi系列,以及它如何提供最佳性价比的设计。虽然英特尔现在无法与英伟达的水平相提并论,但他们肯定会在价值方面积极进取,如果该公司决定利用尚未开发的中国市场,那么英伟达就会有所顾忌。 ... PC版: 手机版:

相关推荐

封面图片

英特尔为 Gaudi 3 AI加速器准备了中国特供版

英特尔为 Gaudi 3 AI加速器准备了中国特供版 英特尔日前发布了性能优于 H100 的AI加速器 Gaudi 3 ,其强劲的性能预计无法满足美国政府对于出口芯片的监管要求。但本周,英特尔还发布了 Gaudi 3 人工智能加速器的中国版。 其中 OAM 兼容夹层卡形态的中国版将在6月份推出,编号HL-328,功耗减半至450W,HMB内存、缓存、解码器等完全保留,预计算力将较常规版减半。PCIe扩展卡形态将在9月份出货,中国版编号HL-388,功耗同样减半至450W。通用基板形态的中国版编号为HLB-325,但具体规格和出货时间暂时不详。

封面图片

英特尔面向中国市场推出全新 Gaudi2 处理器:总内存带宽 2.4TB / s、用于训练 AI

英特尔面向中国市场推出全新 Gaudi2 处理器:总内存带宽 2.4TB / s、用于训练 AI 英特尔 Gaudi2 处理器的架构重点在于高效扩展,以满足大规模语言模型及生成式 AI 模型的需求;该处理器的每张芯片集成了 21 个专用于内部互联的 100Gbps 以太网接口。 在 Stable Diffusion 训练上,英特尔 Gaudi2 处理器展示了从 1 张卡至 64 张卡近线性 99% 的扩展性,从 256 个加速器到 384 个加速器可实现接近线性的 95% 扩展效果 ========= 你这个性能有美国商务部认证

封面图片

性能暴降92%:英特尔中国特供AI芯片曝光

性能暴降92%:英特尔中国特供AI芯片曝光 英特尔在其Gaudi 3 AI芯片白皮书中披露,正准备向中国市场推出“特供版”Gaudi 3。中国特供Gaudi 3包括名为HL-328的OAM兼容夹层卡(Mezzanine Card),和名为HL-388的PCle加速卡两种,其中HL-328将于6月24日推出,HL-388将于9月24日推出。 与原版相比,中国特供版Gaudi 3拥有相同的96MB SRAM片上内存, 128GB HBM2e高带宽内存,带宽为3.7TB/s,拥有PCIe 5.0 x16接口和解码标准。但是由于美国对于AI芯片的出口管制,其综合运算性能(TPP)需要低于4800才能出口到中国, 这也意味中国特供版Gaudi 3的16bit性能不能超过150 TFLOPS。 而原版Gaudi 3在FP16/BF16上的性能可以达到1835 TFLOPS,因此中国特供版Gaudi 3最终可能需要将其AI性能降低约92%,才能符合美国的出口管制要求。 频道:@kejiqu 群组:@kejiquchat

封面图片

【英特尔发布新款AI芯片,希望从英伟达和AMD争抢市场份额】

【英特尔发布新款AI芯片,希望从英伟达和AMD争抢市场份额】 英特尔发布新款AI芯片Xeon 6,紧追英伟达和AMD最近两天先后推出新款AI芯片的步伐。 据了解,英特尔Xeon 6在高强度数据中心工作载荷的性能和电源效率都优于旧款芯片。 英特尔宣布,Gaudi 2 和Gaudi 3 AI加速器的价格低于众多竞争对手的AI芯片产品。 六个月之前,英特尔推出了针对数据中心工作量的第五代Intel Xeon processors,在那两个月之后,发布用于AI模型训练和开发的Gaudi 3处理器。

封面图片

英特尔CEO:别听老黄瞎忽悠 摩尔定律依然有效

英特尔CEO:别听老黄瞎忽悠 摩尔定律依然有效 他说:“与黄仁勋让你们相信的不同,摩尔定律依然活着,而且还活得很好。”基辛格同时强调,作为PC芯片的领先供应商,英特尔将在AI的普及中发挥重要作用。他说:“我认为,它就像25年前的互联网,规模和潜力庞大。我们相信,这是推动半导体行业在2030年之前达到1万亿美元的动力。”在本届台北国际电脑展上,英特尔展示了其最新的至强6(Xeon 6)数据中心处理器。该处理器具有更高效的内核,将使运营商能够将给定任务所需的空间减少到前一代硬件的1/3。盖辛格还称,英特尔的Gaud系统将由戴尔和英业达(Inventec)等合作伙伴提供。Gaud系统将英特尔的芯片编译成多处理器套件,专门用于处理生成式AI的训练。一套配备八个英特尔Gaud 2加速器的套装售价为65,000美元,而由八个英特尔Gaud 3加速器组成的功能更强大的套件将标价12.5万美元。英特尔预计,这两款产品都比竞争对手的产品更实惠。这些Gaudi 3集群中的每一个都由8192个加速器组成,英特尔预计,与同等规模的英伟达H100 GPU集群相比,英特尔产品的AI模型训练时间最多快40%。另外,在执行AI推理任务方面,Gaudi 3的执行速度将比英伟达的H100快一倍,这是从Meta和Mistral等流行模型的测试结果中得出的结论。但是,这些优势可能还不足以推翻英伟达在数据中心AI处理方面的领先地位。Next Curve的分析师Leonard Lee称:“每个加速器的表现不再是最重要的事情。英伟达的最大优势在于拥有一个凝聚和集成的生态系统,以及像NVLink这样的专有技术,确保其计算集群作为一个整体工作。”几十年来,英特尔一直领导着计算机行业。但由于逐渐落后于竞争对手,其营收在过去两年里有所下滑。三年前,基辛格被任命为英特尔CEO,肩负着重新夺回芯片设计和制造领导地位的使命。虽然英特尔的销售额已经停止萎缩,但分析师预计还不会迅速反弹。据预计,英特尔今年的营收将比2021年减少200亿美元。与此同时,英伟达的销售额预计将翻一番,AMD的增长率也将超过10%,这两家公司均更好地利用了AI计算硬件的开支狂潮。基辛格称:“这是我们职业生涯中最重要的时刻。”他重申了英特尔与合作伙伴合作的重要性,并称“我们是为这一刻而生的。” ... PC版: 手机版:

封面图片

英特尔将其 Python NPU 加速库开源

英特尔将其 Python NPU 加速库开源 英特尔长期以来一直在开发 iVPU Linux 内核驱动程序,该驱动程序位于内核上游,用于从 Meteor Lake 开始支持英特尔 NPU(以前称为 VPU)。这个 NPU 加速库是一个方便的 Python 库,可以充分利用 NPU 的潜力。英特尔神经处理单元库支持 8 位量化、Float16 支持、torch.compile 支持、静态形状推理和其他功能。NPU 加速库可从 GitHub 下载,也可通过 PIP 方便地安装: NPU 加速库 GitHub 页面上的 Python 代码示例展示了在 NPU 上进行单矩阵乘法运算、为 NPU 编译模型,甚至在 NPU 上运行 Tiny-Llama 模型。随着人工智能时代的到来以及 NPU 在更多英特尔处理器上的应用,这个库将变得越来越重要。 ... PC版: 手机版:

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人