AMD CEO 认为计算机领域的下一个最重要挑战是能效

AMDCEO苏姿丰(LisaSu)在IEEEISSCC会议上指出,未来十年计算机领域的最重要挑战将是能效。摩尔定律预测的芯片性能增长速度虽然放缓了,但今天的芯片计算能力仍然能每两年半翻一番,超算翻倍所需的时间更短。然而计算机的能效并没有跟上这一步伐,十年后未来的超算可能需要多达500兆瓦的电力。她说,没人真正知道如何实现下一个运算千倍增长的zetta级超算,这必定需要全面的改进效率,不仅包括改进芯片的能效,还需要高效的芯片间通信和低功耗的内存访问。苏姿丰谈论了AMD在数据中心APUMI300上采取的改进能效的众多措施。()投稿:@ZaiHuabot频道:@TestFlightCN

相关推荐

封面图片

AMD公布疯狂芯片提效计划 用能效挑战英伟达会成功吗?

AMD公布疯狂芯片提效计划用能效挑战英伟达会成功吗?而在获奖后的演讲中,苏姿丰透露了AMD未来三年的计划,一个充满野心的计划:AMD正在努力实现2025年将计算能效提高到2020年的30倍的计划,而在这个计划之后,还有在2027年将能效提高到100倍(相对于2020年)的目标。图源:AMD计算能效,简单来说就是指计算机在执行计算任务时,利用能源的有效程度,虽然在各种算力、核心数等性能参数面前,计算能效看起来不太起眼,实质上却是核心性能、功耗管理、制程工艺等技术的体现。更高的计算能效,能够让计算机系统在运行时有着更高的效率,早在2014年,AMD就曾经设定过一个名为“25x20”的计划,希望用6年时间将AMD的处理器、显卡等产品的能效提高25倍。这个计划的结果,就是我们现在所熟知的Zen架构和RDNA架构,凭借两个架构的出色表现,AMD在2020年不仅完成了既定的目标,还超额做到了31.77倍的能效提升。AMD为何一直将计算能效提升作为核心目标之一?首先,我们从目前的AI运算需求出发,看看计算能效提升会带来什么?狂奔的超级计算中心众所周知,AI已经成为当前半导体业界最核心、最庞大的需求,这个需求正在驱动着半导体战车的车轮滚滚向前。前段时间,作为AI时代的领航者,半导体公司英伟达的市值就一度达到2.62万亿美元,甚至超过了德国所有上市公司的市值总和。让英伟达市值暴涨的唯一原因,就是其在AI计算硬件领域的统治级实力,目前全球最顶尖的专业计算卡均出自英伟达,除了主流的H100、H200等芯片外,英伟达前段时间又发布了GB100和GB200,仅单个芯片的算力就相当于以前的一台超级计算机。当然,强大的算力背后并不是没有代价的,H100的TDP高达700W,而最新的GB200的TDP更是高达2700W。而英伟达提供的官方方案中,单个GB200NVL72服务器就可以搭载最高36个GB200芯片,仅芯片本身的功耗就最高可达97200W,并且不包括配套的其他硬件功耗。这还仅仅是开始,一个超级计算中心往往由多个服务器单元组合而成,亚马逊此前就公布了一项计划,预计采购2万个GB200用来组建一个全新的服务器集群。而走在AI研究最前沿的微软和OpenAI,前段时间更是公布了一个雄心勃勃的计划——星际之门。据悉,该计划共分为五个阶段,目的是建造一个人类历史上最大的超级计算中心,预计整个计划的投资将达到1150亿美元,建成后将需要数十亿瓦的电力支持。这座‘星际之门’建成后,仅以耗电量算就足以在全球各大城市中排名前20,更何况它还只是众多计算中心的一员而已。实际上,早在去年开始,就有多份报告指出计算中心的耗电量正在猛增,并且一度导致美国部分城市出现电力供应不足的问题。从能源角度来说,一座发电厂从选址到建成运行,往往需要数年的时间,如果遇到环保组织的抗议,还有可能拖延更久。在能源问题短时间内无法解决的情况下,提高计算能效就是唯一的方法,通过更高效地利用每瓦时电力来维持更大规模的AI模型训练。实际上,有人认为OpenAI的ChatGPT-5进展缓慢,很大程度上就是受限于算力规模无法大幅度提升。苏姿丰在演讲中也提到,提高计算能效可以更好地解决能源与算力之间的矛盾,并且让超级计算中心可以被部署到更多的地方。在一些AI企业的构想中,未来每一座城市都应该拥有自己的超级AI中心,负责处理智能驾驶、城市安全等各方面的AI需求。想要达成这个目标,同时不显著增加城市的能源负担,更高计算能效的显卡就是唯一的解决方案。而且,计算能效也直接关系到AI计算的成本,只有将AI计算的成本降到更低,大面积普及AI才可能成为现实。AMD的疯狂计划在英伟达的刺激下,作为在GPU领域唯一能够与英伟达抗衡的企业,AMD一直在加速推进旗下AI芯片的研发与上市进度,并先后发布了MI300、V80等多款专业运算卡。据报道,为了能够加速AI芯片的进度,苏姿丰对GPU团队进行重组,抽调大量人员支持AI芯片的研发,以至于下一代的AMD消费级显卡发布计划受到严重影响,比如取消原定的旗舰产品发布计划,仅保留中端显卡的发布计划等。在集中科研力量后,AMD目前的进展速度飞快,最新的MI300X在性能上已经超过英伟达的H100,大多42petaFLOPs,并且拥有高达192GB的显存,功耗却与H100相当,仅为750W。凭借优异的计算能效,MI300X成功引起了市场的关注,微软、OpenAI、亚马逊等科技巨头都提交了采购需求,让AMD在计算领域的芯片出货量暴增。根据相关机构预测,2024年AMD的AI芯片出货量可能达到英伟达出货量的10%,并在明年增长至30%。据苏姿丰介绍,为了能够提高芯片的计算能效,AMD研发了多项新的技术,比如2.5D/3D混合封装技术。利用这项技术,AMD可以在封装面积不变的前提下给芯片塞入更多的晶体管和内存,降低芯片与内存交换数据的消耗,有效提升每瓦时的计算性能。此外,AMD还将改进芯片架构,推出能效更高的新一代架构,预计最快将于2025年发布,并实现25x30(2025年计算能效提升30倍)的目标。不过,想要实现27x100(2027年计算能效提升100倍)的目标,还需要在诸多领域做出提升,仅靠制程工艺升级和架构升级恐怕还不太够。不得不说,AMD的这个计划非常疯狂,一旦成功,那么AMD将有望再次与英伟达并肩而行。那么英伟达的反应是什么?其实英伟达很早就给出了回应,早前发布的GB200就是答案,这颗史无前例的算力怪物在计算能效方面的提升同样瞩目。据英伟达的介绍,GB200的推理性能是H100的30倍,计算能效是H100的25倍(综合考虑算力、功耗等参数后的结果)。显然,英伟达的脚步也并不慢,在接下来的3年时间里,不管AMD能否完成疯狂的百倍计划,AI芯片市场都会迎来一场革新。...PC版:https://www.cnbeta.com.tw/articles/soft/1432463.htm手机版:https://m.cnbeta.com.tw/view/1432463.htm

封面图片

IBM计算机“基准”实验显示量子计算机将在两年内超越传统计算机

IBM计算机“基准”实验显示量子计算机将在两年内超越传统计算机这项新研究的成果发表在上周的《自然》杂志上。科学家们使用IBM量子计算机Eagle来模拟真实材料的磁性,处理速度比传统计算机更快。IBM量子计算机之所以能超越传统计算机,是因为其使用了一种特殊的误差缓解过程来补偿噪声带来的影响。而噪声正是量子计算机的一个基本弱点。基于硅芯片的传统计算机依赖于“比特(bit)”进行运算,但其只能取0或1这两个值。相比之下,量子计算机使用的量子比特可以同时呈现多种状态。量子比特依赖于量子叠加和量子纠缠等量子现象。理论上这使得量子比特的计算速度更快,而且可以真正实现并行计算。相比之下,传统计算机基于比特的计算速度很慢,而且需要按顺序依次进行。但从历史上看,量子计算机有一个致命的弱点:量子比特的量子态非常脆弱,来自外部环境的微小破坏也会永远扰乱它们的状态,从而干扰所携带的信息。这使得量子计算机非常容易出错或“出现噪声”。在这一新的原理验证实验中,127量子比特的Eagle超级计算机用建立在超导电路上的量子比特计算了二维固体的完整磁性状态。然后,研究人员仔细测量每个量子比特所产生的噪声。事实证明,诸如超级计算材料中的缺陷等因素可以可靠预测每个量子比特所产生的噪声。据报道,研究小组随后利用这些预测值来模拟生成没有噪音的结果。量子霸权的说法之前就出现过。2019年,谷歌的科学家们声称,公司开发的量子计算机Sycamore在200秒内解决了一个普通计算机需要1万年才能破解的问题。但谷歌量子计算机所解决的问题本质上就是生成一长串随机数,然后检查它们的准确性,并没有什么实际用途。相比之下,用IBM量子计算机完成的新实验是一个高度简化但有真实应用价值的物理问题。2019年谷歌量子霸权研究成果参与者之一、加州大学圣巴巴拉分校物理学家约翰·马丁尼斯(JohnMartinis)表示,“这能让人们乐观认为,它将在其他系统和更复杂的算法中发挥作用。”(辰辰)...PC版:https://www.cnbeta.com.tw/articles/soft/1366285.htm手机版:https://m.cnbeta.com.tw/view/1366285.htm

封面图片

特斯拉开始生产可以媲美超算榜首的 Dojo 超级计算机

特斯拉开始生产可以媲美超算榜首的Dojo超级计算机特斯拉在2023年第二季度财报中概述了大规模解决车辆自动驾驶问题所需的四大技术支柱:超大型真实世界数据集、神经网络训练、车辆硬件和车辆软件。特斯拉表示,它已经开始生产用于训练其自动驾驶车队的Dojo超级计算机,该计算机宣布于2019年。特斯拉已经拥有一台基于英伟达GPU的大型超级计算机,它是世界上最强大的超级计算机之一,但新的Dojo定制计算机使用的是特斯拉设计的芯片。此前,马斯克曾宣称,Dojo的运算能力将达到1ExaFLOP。目前,据公开披露的信息,美国橡树岭国家实验室的超级计算机Frontier是全球首台达到ExaFLOP级别的计算机,也是唯一一台。来源,来自:雷锋频道:@kejiqu群组:@kejiquchat投稿:@kejiqubot

封面图片

英国将建造百亿亿次计算机 性能是其现有最强超级计算机的50倍

英国将建造百亿亿次计算机性能是其现有最强超级计算机的50倍根据TOP500的数据,英国目前最好的超级计算机是同样在爱丁堡运行的ARCHER2。它的Linpack分数为19.54PFlop/s,理论峰值为25.80PFlop/s。为了将其指定为百亿亿次超级计算机,政府要么对Linpack分数进行四舍五入,要么使用理论峰值,因为19.54PFlop/s乘以50距离百亿亿次超级计算机还是差了那么一点。科学、创新和技术部长米歇尔·多尼兰(MichelleDonelan)在评论新计算机的优势时表示:英国政府在爱丁堡资助的这台新的百亿亿级计算机将为英国研究人员提供超快速、多功能的资源,以支持人工智能安全、救生药物和清洁低碳能源方面的开创性工作。这是我们9亿英镑投资的一部分,旨在提升英国的计算能力,帮助我们建立一个更强大的联盟,推动经济增长,创造未来的高技能就业机会,并释放大胆的新发现,改善人们的生活。这台计算机的开发对英国意义重大,因为根据TOP500的数据,目前全球只有一台位于美国的百亿亿次超级计算机,名为Frontier。政府没有透露这款计算机的开发需要多长时间,如果能在短时间内完成,英国会在这一级别的超算俱乐部中保持较长时间的领先地位。本月早些时候,政府还宣布将在布里斯托尔建造一台名为Isambard-AI的新型人工智能超级计算机。它表示,建成后它将成为欧洲最强大的人工智能计算机之一。这两台机器都是3月份宣布的9亿英镑投资的一部分,用于升级该国的计算能力。...PC版:https://www.cnbeta.com.tw/articles/soft/1389005.htm手机版:https://m.cnbeta.com.tw/view/1389005.htm

封面图片

中国第三代自主超导量子计算机 “本源悟空”成功实现四算合一

中国第三代自主超导量子计算机“本源悟空”成功实现四算合一使平台能够充分链接产业生态中的算力供给、应用开发、运营服务、用户等各方能力和资源,推进国产量子算力的规模化应用。此前,本源量子联合上海超级计算中心、国家超级计算郑州中心和中移(苏州)软件技术有限公司(中国移动云能力中心)于2023年8月上线的量超融合先进计算平台已接入“本源悟空”量子计算机。今年4月,“本源悟空”又正式入驻国家超算互联网平台。据悉,截至5月5日,这台目前我国最先进的可编程、可交付超导量子计算机已吸引全球范围内119个国家逾777万人次访问,成功完成超17.8万个运算任务。“本源悟空”是我国第三代自主超导量子计算机,搭载72位自主超导量子芯片“悟空芯”,这款芯片在中国首条量子芯片生产线上制造,共有198个量子比特,其中包含72个工作量子比特和126个耦合器量子比特。“本源悟空”匹配了本源第三代量子计算测控系统“本源天机”,在国内首次真正落地了量子芯片的批量自动化测试,量子计算机的整机运行效率提升了数十倍。...PC版:https://www.cnbeta.com.tw/articles/soft/1429807.htm手机版:https://m.cnbeta.com.tw/view/1429807.htm

封面图片

欧洲最新世界级超级计算机在巴塞罗那建成

欧洲最新世界级超级计算机在巴塞罗那建成欧盟委员会21日发布公报说,欧洲最新的世界级超级计算机“MareNostrum5”已在西班牙巴塞罗那超级计算中心建成,将从明年3月起向欧洲科学界和工业界用户开放。欧盟委员会说,作为世界最强大的十台超级计算机之一,“MareNostrum5”的峰值性能可达每秒31.4亿亿次浮点运算。该计算机专门为解决复杂的科学问题而设计,将支持欧洲在药物和疫苗开发、模拟病毒传播、气候变化、工程、材料科学和地球科学等领域的研究。这台超算也将助力人工智能开发,它使用当今最先进的加速器芯片,可提高欧洲大型人工智能语言模型的性能。欧盟委员会介绍,“MareNostrum5”完全由可持续能源提供动力,其运行时产生的热量将用于为所在建筑供暖,是欧洲最环保的超级计算机。该超算系统总投资额超过1.5亿欧元。今年11月公布的最新全球超级计算机500强榜单显示,世界排名前十的超级计算机中有3台来自欧盟,芬兰的“LUMI”排名第五,意大利的“Leonardo”排名第六,西班牙的“MareNostrum5”排名第八。(新华网)

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人