基于TensorFlow PluggableDevice接口的异构、高性能深度学习扩展插件,将英特尔XPU (GPU、 CPU

基于TensorFlow PluggableDevice接口的异构、高性能深度学习扩展插件,将英特尔XPU (GPU、 CPU 等)设备带入TensorFlow 开源社区,用于AI工作负载加速 | #插件

相关推荐

封面图片

【英特尔GPU取经路能否“通关”?】英特尔“老将”Rohit Verma将从AMD回到英特尔,担任英特尔GPU部门首席产品架构师

【英特尔GPU取经路能否“通关”?】英特尔“老将”Rohit Verma将从AMD回到英特尔,担任英特尔GPU部门首席产品架构师。在过去的八年间,Rohit Verma在AMD参与了台式机和笔记本的独显设计以及CPU、GPU、电源等更广泛的SoC架构设计。 #抽屉IT

封面图片

《视频处理加速及应用实践:基于英特尔GPU》

《视频处理加速及应用实践:基于英特尔GPU》 简介:视频处理加速及应用实践:基于英特尔GPU是一门系统性的学习课程,涵盖相关领域的核心知识。通过详尽的讲解和案例分析,帮助学习者深入理解课程主题,提高实践应用能力,适合希望扩展知识储备、提升专业技能的学员。 标签: #知识#学习资源#技能提升 文件大小:NG|链接:

封面图片

DIGITIMES 警告高性能 CPU 和 GPU 在 2022 年还将涨价

DIGITIMES 警告高性能 CPU 和 GPU 在 2022 年还将涨价 由于外界各种因素制约,今年PC处理器价格可能要大幅上涨了,而一些代工厂已经提前行动了,所以有需求的还是可以考虑合适的机会入手了。 据Digitimes报道,消息人士表示,高性能CPU、GPU和FPGA芯片的供应商预计将在2022年大幅提高新产品价格,以抵消不断上涨的代工成本和持续高涨的运费。 报道中提到,AMD将提高在台积电生产的所有7nm和5nm芯片的报价,因为从今年开始,台积电将成熟和先进工艺节点的报价提高了10-20%。 据悉,NV也已向台积电支付了从今年开始的 5nm RTX 40 GPU系列长期订单的预付款,并可能将部分高制造成本转嫁给客户。

封面图片

英特尔 Battlemage BMG-G31 GPU 现已曝光

英特尔 Battlemage BMG-G31 GPU 现已曝光 据说这些 Arc GPU 将在未来几个月内推出,但到目前为止英特尔一直守口如瓶,因为他们目前正专注于 Lunar Lake 的 Xe2 集成产品。英特尔的 Design-iN Tools Store 似乎已经透露,Arc Battlemage BMG-G31 GPU 确实是真的,而且已经对这款即将推出的芯片进行了测试。该商店列出了"PTT Engagement - BGA3283-BMG-G31 VRTT Interposer - Prototypes"(PTT参与BGA3283-BMG-G31 VRTT Interposer原型),显示该特定 SKU 采用 BGA 3283 球脚,这一信息对玩家来说可能并不重要,但它确实表明该芯片的尺寸比之前出现在同一网站上的其他 Battlemage 芯片要大。ACM-G10:BGA 2660BMG-G21: BGA 2362BMG-G10:BGA 2727BMG-G31: BGA 3283根据@SquashBionic 分享的信息,Intel Arc Battlemage BMG-G31 GPU 据称将拥有 32 个 Xe2 核心,并将保留 GDDR6 接口,因此总共将拥有 4096 个 ALU,这与 Arc A770 显卡上现有的旗舰产品、基于 Alchemist 的 ACM-G10 非常相似。不过,随着性能的提升,如果有适当的软件支持和物美价廉的产品支持,我们还是可以期待一款出色的主流产品。另外还提到,Battlemage 独立显卡将采用原生 Gen5 设计,但也将向后兼容以前的 PCIe 标准。几个月前,RedGamingTech首次披露了有关 Battlemage GPU SKU 和 BMG-G31 芯片的信息。根据详细信息,G31 芯片拥有 32 个 Xe2 内核和 256 位接口,而Battlemage BMG-G21 芯片据说将拥有 20 个 Xe 内核和 192 位总线接口。英特尔的下一代 Battlemage GPU 有可能在今年的创新大会上正式发布,发布时间可能在 2024 年底或 2025 年初。与此同时,英特尔的 Xe2 图形架构将在 Lunar Lake CPU 中首次亮相,其下一代 Arc iGPU 设计有望在早期的合成基准测试中提供令人印象深刻的性能提升。 ... PC版: 手机版:

封面图片

英特尔在整个CPU和GPU产品组合中为微软Phi-3 AI模型做好了准备

英特尔在整个CPU和GPU产品组合中为微软Phi-3 AI模型做好了准备 在讨论细节之前,我们先来看看微软的 Phi-3 开放模型系列。该公司的新 GenAI 模型侧重于在更小、更高效的层面上提供功能,偏离了行业规范。有了Phi-3,我们可以看到小语言模型(SLM)的出现,它是处理能力有限的低功耗设备的理想选择。英特尔已成为首批在其产品阵容中支持 SLM 的硬件制造商之一,现在英特尔的 Gaudi AI 加速器、至强和酷睿 Ultra CPU 以及英特尔的 Arc GPU(独立和集成)都已优化,以支持微软的 Phi-3 型号。英特尔公司副总裁兼数据中心与人工智能软件部总经理 Pallavi Mahajan 介绍说:"我们利用业内最新的人工智能模型和软件,为客户和开发人员提供强大的人工智能解决方案。与人工智能软件生态系统中的其他领导者(如微软)积极合作,是让人工智能无处不在的关键。我们很荣幸能与微软密切合作,确保英特尔硬件(涵盖数据中心、边缘和客户端)积极支持几种新的Phi-3模型。"微软发布了多个 Phi-3 GenAI 模型,并根据各自的参数进行了分类。这些型号包括迷你型、小型和中型;有趣的是,英特尔展示了其所有开放型号产品的性能。从英特尔第六代至强 CPU(Granite Rapids)开始,该公司对 Phi-3 中型 4k 和 128k 变体进行了基准测试,与第五代至强(Emerald Rapids)相比,该平台的性能提高了 2 倍。谈到英特尔的酷睿Ultra CPU平台,该公司表示,Phi-3型号将催化边缘人工智能进程,并将提供"个性化和响应速度"等多项优势。为此,该公司用英特尔酷睿 Ultra 7 165H 对 Phi-3 mini 机型进行了测试,板载的独立 GPU 为 Arc A770,基准测试确实显示出令人印象深刻的性能和词元生成延迟。微软Phi-3人工智能模型的首次亮相确实将为个性化人工智能计算时代打开新的大门,而凭借现代处理器所拥有的性能,运行这样的模型完全不是问题。 ... PC版: 手机版:

封面图片

英特尔至强“Granite Rapids”晶圆图片现身 首款基于英特尔3工艺的硅片

英特尔至强“Granite Rapids”晶圆图片现身 首款基于英特尔3工艺的硅片 英特尔3工艺的晶体管密度和性能可与台积电N3系列和三星3GA系列节点相媲美。晶圆包含正方形的 30 核芯片,其中两个组成一个"Granite Rapids-XCC"处理器,CPU 内核数可达到 56 核/112 线程(每个芯片有两个内核未使用)。瓦片上的 30 个内核中,每个都是一个"Redwood Cove"P 内核。相比之下,目前的"Emerald Rapids"至强处理器使用的是"Raptor Cove"内核,并且是在英特尔 7 代工节点上制造的。英特尔正计划通过在硅片上实施几种固定功能加速器来加快流行的服务器工作负载,从而克服与 AMD EPYC(包括即将推出的 EPYC"都灵"Zen 5 处理器及其传闻中的 128 核/256 线程数量)在 CPU 内核数量上的差距。预计"Redwood Cove"内核将成为英特尔首个采用 AVX10 和 APX 的 IA 内核。 ... PC版: 手机版:

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人