英国最快的超级计算机 Isambard-AI 正式上线

英国最快的超级计算机 Isambard-AI 正式上线 这台耗资 2.25 亿英镑(约合 2.73 亿美元)的超级计算机还在 Green500 榜单上名列第2,该榜单对超级计算机的能效进行了排名,其能效等级为每瓦特 68.8 gigaflops。Isambard-AI 建立在基于 HPE Cray EX 的系统上,满负荷运行时将包含 5448 个 NVIDIA GH200 超级芯片,可提供 200 petaflops Linpack 和 21 exaflops 的人工智能计算能力。该机器的建设目前处于第一阶段,通过 168 个 GPU 提供 7.4 petaflops 的 Linpack 和 647 petaflops 的 AI 计算能力。剩余的 5280 个 NVIDIA GH200 超级芯片将于今年夏天晚些时候运抵国家计算中心,使 Isambard-AI 达到满负荷运行。该系统还采用了 HPE Slingshot 11 互联技术,使用 Cray Clusterstor E1000 提供近 25PB 的存储空间,并通过 HPE 性能优化数据中心 (POD) 托管在一个自冷却、独立的数据中心内。热量再利用系统将把废热引向附近的建筑物。"随着布里斯托尔大学超级计算机 Isambard-AI 第一阶段的启动,我们见证了英国科学、创新和技术的开创性时刻,"英国人工智能部长乔纳森-贝里(Jonathan Berry)说。"这台世界级的设备将彻底改变英国的研究可能性,我们世界首创的人工智能安全研究所也将成为受益机构之一,利用全球最强大的计算机系统之一来推动他们的重要研究。"他补充说:"Isambard-AI 不仅是世界上速度最快的超级计算机之一,而且还为具有生态意识的计算设定了标准,在效率和可持续性方面处于领先地位。从人工智能安全到医疗保健和气候研究,它的能力无与伦比,标志着英国成为人工智能和负责任创新的全球领导者。"Isambard-AI 最终将与剑桥大学的Dawn 超级计算机集群相连接。该系统是戴尔和英特尔合作两年的成果,已于今年 2 月投入使用。虽然还处于第一阶段,但 Dawn 目前已经提供了 19 petaflops 的 FP64 性能。 ... PC版: 手机版:

相关推荐

封面图片

英特尔"Aurora"突破Exaflops障碍 成为AI领域速度最快的超级计算机

英特尔"Aurora"突破Exaflops障碍 成为AI领域速度最快的超级计算机 由英特尔、阿贡国家实验室(Argonne National Laboratory)和HPE合作研发的Aurora超级计算机以585.34 petaflops的部分系统运行速度排名第二。阿贡的早期科学计划取得了重大进展,该计划重点关注科学研究中的高性能计算和人工智能应用。图为安装团队成员在阿贡国家实验室的众多机架中穿行。(图片来源:阿贡国家实验室)Aurora超级计算机部署在阿贡国家实验室,由惠普企业公司(HPE)合作建造,有望成为高性能计算和人工智能领域表现最出色的产品之一。该平台由英特尔至强 CPU Max 和数据中心 GPU Max 系列提供支持,与AMD 展开了激烈的竞争,后者成功地率先突破了Exaflops关卡。与此同时,尽管早在 2019 年就宣布了 Aurora 超级计算机,但它几乎没能达到预期目标,但如今,该系统的运行能力已达到 87%,即总共 9234 个节点。在规格方面,Aurora 超级计算机由 166 个机架组成,其中包括 10624 个刀片服务器、21248 个英特尔至强 CPU Max 芯片(第四代)和 63744 个英特尔数据中心 GPU Max 系列单元(Ponte Vecchio)。它基于 HPE slingshot 光纤架构进行互连,使用 84992 个端点。在性能指标方面,Aurora 超级计算机在 HPL LINPACK 基准测试中名列第二,但仅用了总节点容量的 87%(9234 个节点对 10624 个节点)就达到了 1.012 exaflops,成功突破了1 Exaflops障碍。在 HPCG 测试中,该系统也以 5612 TFLOPs/second 的成绩排名第三,仅使用了系统的 39%。利用 Xe 核心架构及其多个人工智能硬件模块,曙光超级计算机目前在人工智能性能排行榜上名列第一,额定总性能为 10.6 AI Exaflops。该性能使用 LINPACK 混合精度(HPL-MxP)基准进行测量。采用英特尔至强CPU Max系列和英特尔数据中心GPU Max系列技术部署的新型超级计算机彰显了英特尔推进高性能计算和人工智能的目标。这些系统包括欧洲-地中海气候变化中心(CMCC)的Cassandra,用于加速气候变化建模;意大利国家新技术、能源和可持续经济发展局(ENEA)的CRESCO 8,用于实现核聚变能源的突破;德克萨斯高级计算中心 (TACC),该中心已全面投入使用,可对超音速湍流进行生物数据分析,并对多种材料进行原子模拟;以及英国原子能管理局 (UKAEA),用于解决未来核聚变发电厂设计中的内存约束问题。混合精度人工智能基准测试的结果将为英特尔面向人工智能和高性能计算的下一代 GPU(代号为 Falcon Shores)奠定基础。Falcon Shores将利用下一代英特尔Xe架构和英特尔高迪的最佳性能。这种集成实现了统一的编程接口。英特尔至强6的早期性能结果显示,与上一代产品相比, 配备P核和多路复用器组合级(MCR)内存(8800 MT/s)的实际高性能计算应用(如欧洲海洋建模核心(NEMO))的性能提高了2.3倍,为成为高性能计算解决方案的首选主机CPU奠定了坚实的基础。 ... PC版: 手机版:

封面图片

Inflection AI宣布打造2.2万块H100计算卡的AI超级计算机

Inflection AI宣布打造2.2万块H100计算卡的AI超级计算机 一家名为"Inflection AI"的人工智能创业公司近日宣布,他们计划利用2.2万块NVIDIA H100计算卡打造一台规模宏大的AI超级计算机。这台超级计算机将由近700个机柜组成,每个机柜还将配备四块Intel至强处理器,旨在提供卓越的计算能力。据悉,该系统的功耗预计将达到31兆瓦,相当于每小时消耗3.1万度电。 Inflection AI此次计划打造的AI超级计算机被视为世界顶级之一,而能够轻松获取大量NVIDIA H100计算卡的原因在于,NVIDIA正准备对该公司进行投资。来源 , 来自:雷锋 频道:@kejiqu 群组:@kejiquchat 投稿:@kejiqubot

封面图片

微软和 OpenAI 计划斥资 1000 亿美元打造“星际之门” AI 超级计算机

微软和 OpenAI 计划斥资 1000 亿美元打造“星际之门” AI 超级计算机 据三名参与该提案私下对话的人士透露,微软和​​ OpenAI 的高管一直在为一个数据中心项目制定计划,该项目将包含一台超级计算机,配备数百万个专用服务器芯片,为 OpenAI 的人工智能提供动力。据一位曾与 OpenAI 首席执行官萨姆·奥尔特曼交谈过的人士以及一位看过微软初步成本估算的人士称,该项目的成本可能高达1000亿美元。微软可能会负责为该项目提供融资,该项目的成本比当今一些最大的数据中心高出100倍,这表明未来几年可能需要巨额投资来建立人工智能的计算能力。高管们预计,拟议中的位于美国的超级计算机 (他们将其称为“星际之门”) 是两家公司计划在未来六年内建造的一系列设施中最大的一个。微软高管希望最早在2028年发布“星际之门” AI 超级计算机。此外,微软和 OpenAI 计划为 AI 开发数据中心项目。

封面图片

AMD将搭建由120万颗GPU驱动的全球最强AI超级计算机

AMD将搭建由120万颗GPU驱动的全球最强AI超级计算机 AMD 数据中心解决方案总经理 Forrest Norrod 在接受The Next Platform 采访时透露,他们收到了客户关于使用 120 万个 GPU 构建人工智能训练集群的真实询问。从这个角度来看,目前的人工智能训练集群通常使用数千个 GPU,通过高速互连连接到多个本地服务器机架上。目前正在考虑的人工智能开发规模是前所未有的。诺罗德说:"正在筹建的一些训练集群确实强大得令人匪夷所思。事实上,目前已知用于训练人工智能模型的最大超级计算机是Frontier,它拥有37888个Radeon GPU,这使得AMD潜在的超级计算机比Frontier强大30倍。"当然,事情没那么简单。即使以目前的功率水平,在创建人工智能训练集群时也有大量隐患需要考虑。人工智能训练需要较低的延迟来提供及时的结果,需要消耗大量的电能,而且必须考虑到硬件故障,即使只有几千个 GPU 也不例外。大多数服务器的利用率在20%左右,并在远程机器上处理数千个小型异步作业。然而,人工智能培训的兴起正在导致服务器结构发生重大变化。为了跟上机器学习模型和算法的发展,人工智能数据中心必须配备专门为这项工作设计的大量计算能力。人工智能训练本质上是一项大型同步作业,需要集群中的每个节点尽可能快地来回传递信息。最有趣的是,这些数据来自 AMD,而 AMD 在 2023 年的数据中心 GPU 出货量中只占不到 2%。而占据另外 98% 市场份额的 NVIDIA 则对客户要求其开发的产品守口如瓶。作为市场领导者,我们只能想象他们正在开发什么。虽然拟议中的 120 万 GPU 超级计算机可能看起来有些离谱,但诺罗德称,"非常清醒的人"正在考虑在人工智能训练集群上花费多达千亿美元。这并不令人震惊,因为在过去几年里,人工智能在科技界的发展可谓突飞猛进。看来,企业已经准备好在人工智能和机器学习上投入巨资,以保持竞争力。 ... PC版: 手机版:

封面图片

联想拿下英国哈特里中心超级计算机的建造订单

联想拿下英国哈特里中心超级计算机的建造订单 联想宣布,这台新超级计算机将"在战略上定位为促进以发现为主导的工业研究,重点解决天气和气候建模、清洁能源计划、药物发现、健康技术、新材料、汽车进步和法律应用等领域的全球挑战"。价值 3000 万英镑(3780 万美元)的联想超级计算机设施已于今年2 月开工建设。据介绍,该系统的功率是哈特里中心斯卡费尔派克系统的十倍,但由于采用了联想海王星技术的直接温水冷却系统,所需的能源更少,HPC 将主要基于 GPU 搭建,但没有提供更多细节。2022 年超级计算大会上展出的联想 1U NeptuneThe Reg配置了双 AMD Genoa CPUS 和四个 NVIDIA H100 GPU。联想的 3USR675 V3等系统也采用了 Neptune 冷却系统,可容纳 4 个 H100 和 4 个连接 NVLink 的 SXM5 GPU。Scafell Pike 还使用液体冷却。BullSquana X1000 系统包含24960 个英特尔 Skylake 内核和"紧密耦合的英特尔和 NVIDIA 架构"。哈特里中心是英国唯一一个致力于行业参与的超级计算中心,或者说是英国唯一的超级计算中心之一。联想超级计算机将成为该中心价值2.1亿英镑(约合2.65亿美元)的哈特里国家数字创新中心(HNCDI)计划的一部分,该计划为希望提高技能和采用人工智能的企业和公共部门机构提供支持。该程序已得到 IBM 的支持。 ... PC版: 手机版:

封面图片

计算机科学家认为不应神化 AI

计算机科学家认为不应神化 AI 计算机科学家 Jaron Lanier 在《纽约客》发表文章《There Is No AI》,提出应停止对人工智能的神化,而将其作为一种创新的社会协作形式来看待。他反对最近呼吁停止训练更高级人工智能的联署信,并再次提出“数据尊严”概念:结束人工智能黑箱,记录比特的来源,“人们可以为他们创造的东西获得报酬,即使这些东西是通过大模型过滤和重新组合的”,“当一个大模型提供有价值的输出时,数据尊严的方法将追踪最独特和有影响力的贡献者。” 频道 @WidgetChannel 投稿 @WidgetPlusBot

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人