英特尔Gaudi 2-D加速器出现在新的Linux补丁中 可能是中国特供版

英特尔Gaudi 2-D加速器出现在新的Linux补丁中 可能是中国特供版 在此之前,我们曾看到Gaudi 2-C 型号浮出水面,但我们没有收到英特尔方面确切的消息。我们所知道的英特尔新发布的唯一一款 AI 加速器是下一代Gaudi 3 AI 加速器,在 Computex 2024 上有过广泛报道,但看起来该公司可能正在计划修订型号。深入研究拉取请求,除了新的英特尔Gaudi 2-D 模型使用了与原始Gaudi 2 AI 加速器相同的代码路径这一事实之外,补丁中并没有太多关于新模型的细节,这表明"2D"变体可能是针对特定客户群的修订版。让人联想到的一点是,英特尔可能正在准备进军中国市场,正如之前报道的那样,随着这些变体的浮出水面,公司可能会决定在中国提供中低端型号,但目前还不能确定。Gaudi 2-D 肯定不是英特尔及其人工智能部门的终点。在最近的 Computex 主题演讲上,该公司对其在人工智能市场的未来表现出了极大的乐观,尤其是Gaudi系列,以及它如何提供最佳性价比的设计。虽然英特尔现在无法与英伟达的水平相提并论,但他们肯定会在价值方面积极进取,如果该公司决定利用尚未开发的中国市场,那么英伟达就会有所顾忌。 ... PC版: 手机版:

相关推荐

封面图片

英特尔为 Gaudi 3 AI加速器准备了中国特供版

英特尔为 Gaudi 3 AI加速器准备了中国特供版 英特尔日前发布了性能优于 H100 的AI加速器 Gaudi 3 ,其强劲的性能预计无法满足美国政府对于出口芯片的监管要求。但本周,英特尔还发布了 Gaudi 3 人工智能加速器的中国版。 其中 OAM 兼容夹层卡形态的中国版将在6月份推出,编号HL-328,功耗减半至450W,HMB内存、缓存、解码器等完全保留,预计算力将较常规版减半。PCIe扩展卡形态将在9月份出货,中国版编号HL-388,功耗同样减半至450W。通用基板形态的中国版编号为HLB-325,但具体规格和出货时间暂时不详。

封面图片

性能暴降92%:英特尔中国特供AI芯片曝光

性能暴降92%:英特尔中国特供AI芯片曝光 英特尔在其Gaudi 3 AI芯片白皮书中披露,正准备向中国市场推出“特供版”Gaudi 3。中国特供Gaudi 3包括名为HL-328的OAM兼容夹层卡(Mezzanine Card),和名为HL-388的PCle加速卡两种,其中HL-328将于6月24日推出,HL-388将于9月24日推出。 与原版相比,中国特供版Gaudi 3拥有相同的96MB SRAM片上内存, 128GB HBM2e高带宽内存,带宽为3.7TB/s,拥有PCIe 5.0 x16接口和解码标准。但是由于美国对于AI芯片的出口管制,其综合运算性能(TPP)需要低于4800才能出口到中国, 这也意味中国特供版Gaudi 3的16bit性能不能超过150 TFLOPS。 而原版Gaudi 3在FP16/BF16上的性能可以达到1835 TFLOPS,因此中国特供版Gaudi 3最终可能需要将其AI性能降低约92%,才能符合美国的出口管制要求。 频道:@kejiqu 群组:@kejiquchat

封面图片

英特尔面向中国市场推出全新 Gaudi2 处理器:总内存带宽 2.4TB / s、用于训练 AI

英特尔面向中国市场推出全新 Gaudi2 处理器:总内存带宽 2.4TB / s、用于训练 AI 英特尔 Gaudi2 处理器的架构重点在于高效扩展,以满足大规模语言模型及生成式 AI 模型的需求;该处理器的每张芯片集成了 21 个专用于内部互联的 100Gbps 以太网接口。 在 Stable Diffusion 训练上,英特尔 Gaudi2 处理器展示了从 1 张卡至 64 张卡近线性 99% 的扩展性,从 256 个加速器到 384 个加速器可实现接近线性的 95% 扩展效果 ========= 你这个性能有美国商务部认证

封面图片

英特尔正式推出至强6系列处理器 力图赶超英伟达

英特尔正式推出至强6系列处理器 力图赶超英伟达 英特尔展示了其新一代至强数据中心处理器,首次启用全新的命名方式“至强6(Xeon 6)”,将从现在到明年一季度分批次陆续登场。至强6系列分为E和P系列。其中,P系列主要针对高性能计算、数据库与分析、人工智能、网络、边缘和基础设施/存储等计算密集型和AI工作负载,最多配备128个性能核心,包括6900P/6700P/6500P/6300P等。E系列主要面向高密度、可扩展负载等,优化应用的效率表现,最多配备288个核心,包括6700E/6900E处理器。据悉,“至强6”系列处理器虽然没有采用消费端的P核+E核的异构架构设计,但彼此共享硬件平台、软件开发堆栈。新的至强6系列处理器拥有更高效的内核,可以让数据中心运营商将特定任务所需的空间减少到上一代硬件的三分之一。另外,与AMD(AMD.US)、高通(QCOM.US)等竞争对手一样,英特尔也吹嘘其新的系列处理器的性能明显好于现有产品。与此同时,英特尔正式发布了Lunar Lake笔记本处理器,用于下一代AI PC,号称相比上一代产品AI性能提升3倍。英特尔还推出了AI PC开发套件,搭载Lunar Lake处理器、32GB LPDDR5内存、512GB存储。英特尔表示,AI PC开发套件后续可以升级到Panther Lake芯片(预计明年推出)。英伟达首席执行官黄仁勋曾表示,在人工智能时代,英特尔等传统处理器正在失去动力。但Pat Gelsinger表示,作为领先的个人电脑芯片制造商,英特尔将在人工智能的扩张中发挥重要作用。在AI加速器方面,英特尔表示,包含八块AI芯片的Gaudi 3加速器套件售价大约为12.5万美元,相较于上一代Gaudi 2的6.5万美元标价有所上升;该系统将由戴尔科技(DELL.US)和Inventec Corp.等合作伙伴提供。不过,英特尔还强调,与竞争对手的产品相比,其价格仍然具有显著优势。根据供应商Thinkmate的估算,配备八个英伟达 H100 AI芯片的同类服务器系统成本可能超过30万美元。据悉,英特尔表示,相比英伟达 H100,Gaudi 3的人工智能推理性能平均提高50%,能效平均提高40%。基准测试中,Gaudi 3可以在Llama2-7B、Llama2-13B模型中将训练时间缩短到英伟达 H100 的一半,同时推理吞吐量也比后者平均高出了50%。不过,英特尔Gaudi 3的这些优势可能不足以推翻英伟达在数据中心处理器领域的领先地位。neXt Curve分析师Leonard Lee表示:“单个加速器的性能不再是最重要的事情。英伟达最大的优势在于它拥有一个有凝聚力的集成生态系统,以及像NVLink这样的专有技术,可以确保其计算集群作为一个整体运行。它的力量在于能够创造一个巨大的逻辑加速器。”由于落后于竞争对手,英特尔的收入在过去两年中有所下滑。三年前,为了扭转颓势,Pat Gelsinger重回英特尔,并斥巨资振兴公司产品、建立了一个工厂网络。Pat Gelsinger表示,这将重新夺回英特尔在芯片设计和制造领域的领先地位。尽管英特尔的销售额已经停止萎缩,但分析师并不认为会迅速反弹,且该公司到2024年底的年度收入将比2021年减少200亿美元。与此同时,据估计,英伟达的销售额将翻一番、AMD的销售额增长率将超过10%,因为这两家公司将更好地利用企业在人工智能计算硬件上的大规模支出。 ... PC版: 手机版:

封面图片

英特尔CEO:别听老黄瞎忽悠 摩尔定律依然有效

英特尔CEO:别听老黄瞎忽悠 摩尔定律依然有效 他说:“与黄仁勋让你们相信的不同,摩尔定律依然活着,而且还活得很好。”基辛格同时强调,作为PC芯片的领先供应商,英特尔将在AI的普及中发挥重要作用。他说:“我认为,它就像25年前的互联网,规模和潜力庞大。我们相信,这是推动半导体行业在2030年之前达到1万亿美元的动力。”在本届台北国际电脑展上,英特尔展示了其最新的至强6(Xeon 6)数据中心处理器。该处理器具有更高效的内核,将使运营商能够将给定任务所需的空间减少到前一代硬件的1/3。盖辛格还称,英特尔的Gaud系统将由戴尔和英业达(Inventec)等合作伙伴提供。Gaud系统将英特尔的芯片编译成多处理器套件,专门用于处理生成式AI的训练。一套配备八个英特尔Gaud 2加速器的套装售价为65,000美元,而由八个英特尔Gaud 3加速器组成的功能更强大的套件将标价12.5万美元。英特尔预计,这两款产品都比竞争对手的产品更实惠。这些Gaudi 3集群中的每一个都由8192个加速器组成,英特尔预计,与同等规模的英伟达H100 GPU集群相比,英特尔产品的AI模型训练时间最多快40%。另外,在执行AI推理任务方面,Gaudi 3的执行速度将比英伟达的H100快一倍,这是从Meta和Mistral等流行模型的测试结果中得出的结论。但是,这些优势可能还不足以推翻英伟达在数据中心AI处理方面的领先地位。Next Curve的分析师Leonard Lee称:“每个加速器的表现不再是最重要的事情。英伟达的最大优势在于拥有一个凝聚和集成的生态系统,以及像NVLink这样的专有技术,确保其计算集群作为一个整体工作。”几十年来,英特尔一直领导着计算机行业。但由于逐渐落后于竞争对手,其营收在过去两年里有所下滑。三年前,基辛格被任命为英特尔CEO,肩负着重新夺回芯片设计和制造领导地位的使命。虽然英特尔的销售额已经停止萎缩,但分析师预计还不会迅速反弹。据预计,英特尔今年的营收将比2021年减少200亿美元。与此同时,英伟达的销售额预计将翻一番,AMD的增长率也将超过10%,这两家公司均更好地利用了AI计算硬件的开支狂潮。基辛格称:“这是我们职业生涯中最重要的时刻。”他重申了英特尔与合作伙伴合作的重要性,并称“我们是为这一刻而生的。” ... PC版: 手机版:

封面图片

英特尔将其 Python NPU 加速库开源

英特尔将其 Python NPU 加速库开源 英特尔长期以来一直在开发 iVPU Linux 内核驱动程序,该驱动程序位于内核上游,用于从 Meteor Lake 开始支持英特尔 NPU(以前称为 VPU)。这个 NPU 加速库是一个方便的 Python 库,可以充分利用 NPU 的潜力。英特尔神经处理单元库支持 8 位量化、Float16 支持、torch.compile 支持、静态形状推理和其他功能。NPU 加速库可从 GitHub 下载,也可通过 PIP 方便地安装: NPU 加速库 GitHub 页面上的 Python 代码示例展示了在 NPU 上进行单矩阵乘法运算、为 NPU 编译模型,甚至在 NPU 上运行 Tiny-Llama 模型。随着人工智能时代的到来以及 NPU 在更多英特尔处理器上的应用,这个库将变得越来越重要。 ... PC版: 手机版:

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人