【2021图灵奖揭晓:高性能计算先驱、超算TOP500榜单创始人之一Jack Dongarra获奖】@包云岗:Jack Dong

【2021图灵奖揭晓:高性能计算先驱、超算TOP500榜单创始人之一Jack Dongarra获奖】@包云岗:Jack Dongarra教授真可谓是中国高性能计算界的老朋友。疫情前他每年都要到中国来好多趟,穿梭于中国的各个超算中心。 #抽屉IT

相关推荐

封面图片

清华大学集成电路学院教授魏少军:依靠工艺技术进步已几乎无法实现更高性能的计算

清华大学集成电路学院教授魏少军:依靠工艺技术进步已几乎无法实现更高性能的计算 今日中国半导体行业协会IC设计分会理事长、清华大学集成电路学院教授魏少军在以“创芯未来 共筑生态”为主题的2023中国临港国际半导体大会上对记者表示,当前依靠工艺技术进步几乎无法实现更高性能的计算,特别是从现有计算芯片的主流路线推演,已难以满足Z级超算的性能、功耗和成本需求,需要研发新的计算芯片架构来应对智能化、大算力的新挑战。 来源:

封面图片

Frontier 再次登顶 Top500 超算榜单

Frontier 再次登顶 Top500 超算榜单 Top 500 项目公布了最新的超算榜单,美国田纳西州橡树岭国家实验室(ORNL)的 Frontier 超算去年初成为第一个真正突破 Exascale 大关的超算,它再次高居榜首。Frontier 由 HPE Cray EX 制造,使用 AMD EPYC 64C 2GHz 处理器,共 8,699,904 个核心,峰值性能 1.194 Exaflop/s。日本的 ARM 超算富岳排在第二位,性能 442 petaflops。芬兰欧洲超算中心的新超算 LUMI 排在第三位,同样使用第三代 AMD EPYC 处理器,共 2,220,288 个核心,性能 309 petaflops。第四是意大利超算 Leonardo,性能 174 petaflops,第五 IBM Summit(148.6 petaflops),之后是 IBM Sierra,神威太湖之光, Perlmutter,英伟达超算 Selen,天河二号 A。排名前十的超算和去年下半年完全相同。有四台使用了 AMD EPYC 处理器,两台使用 IBM Power 处理器,ARM 处理器一台,申威处理器一台,两台使用了英特尔的至强处理器。在 Top 500 中,美国有 150 台,中国 134 台,德国 36 台,日本 33 台,法国 24 台。联想制造的超算数量最多 168 台,其次是 HPE 的 100 台,浪潮的 43 台。来源 , 来自:雷锋 频道:@kejiqu 群组:@kejiquchat 投稿:@kejiqubot

封面图片

全球Top500超算公布:Frontier蝉联第一 中国超算不再参加测试

全球Top500超算公布:Frontier蝉联第一 中国超算不再参加测试 Frontier蝉联第一,Aurora排名第二在Top500超算榜单中,前十大性能最强超级计算机的排名基本上与六个月前在SC23会议期间公布的排名保持一致。唯一的新进前10的超级计算机是来自瑞士国家超级计算中心(CSCS)的Alps machine,排名第6名位。具体前十名单如下:1、Frontier以 1.206 EFlop/s的HPL性能继续蝉联第一。该超算位于美国田纳西州的橡树岭国家实验室(ORNL),由美国能源部(DOE)运营。其采用了HPE Cray EX235a架构,2GHz AMD EPYC 64C CPU和AMD Instinct 250X GPU,共有8699904个CPU和GPU核心,并借助于Slingshot 11网络进行数据传输。此外,Frontier还具有高达52.59 GFlops/W的额定能效,2、Aurora以1.012 Exaflop/s的HPL性能排名第二。相比去年首次上榜时(当时未全部安装完成)性能几乎翻了一倍。该超算安装在美国伊利诺伊州的阿贡国家实验室,也是由美国能源部运营。Aurora 基于HPE Cray EX网络,整合了21248个Intel Xeon Max系列CPU、63744个Intel Max系列GPU、20.42PB内存,峰值性能号称可达 2 EFlop / s,远超 Frontier。3、Eagle以561.2PFlop/s的HPL性能排名第三。该超算安装在微软Azure云平台上,并且它依然是Top500超算中最高排名的云计算系统。这款微软NDv5系统的强大性能,源于英特尔Xeon Platinum 8480C处理器和英伟达(NVIDIA) H100 GPU加速器的结合。4、Fugaku凭借其442 PFlop/s的HPL性能排名第四。该超算安装在日本神户的理研计算科学研究中心(R-CCS),基于 2.2GHz Fujitsu A64FX 48C处理器,Tofu interconnect D互联,共计拥有7630848个核心,继续保持了美国以外地区排名最高的超级计算机的地位。5、LUMI以379.7 PFlop/s的HPL性能排名第五。该超算安装在芬兰CSC EuroHPC中心,是欧洲最强的超级计算机,其基于HPE Cray EX235a系统,AMD第三代EPYC 64C 2GHz处理器,AMD Instinct MI250X加速器,Slingshot-11网络、6、Alps 以270 PFlop/s的HPL性能排名第六。该超算安装于瑞士国家超级计算中心 (CSCS),基于HPE Cray 254n系统构建的超算,3.1GHz NVIDIA Grace 72C处理器,NVIDIA GH200超级芯片,Slingshot-11网络互联。7、Leonardo以241.2PFlop/s的HPL性能排名第七。该超算安装在意大利CINECA的EuroHPC,基于Atos BullSequana XH2000系统,由英特尔Xeon Platinum CPU和NVIDIA A100加速器提供强大的计算能力,还采用了四轨NVIDIA HDR100 Infiniband。8、MareNostrum 5 ACC以175.3PFlop/s的HPL性能排名第八。该超算安装在西班牙的EuroHPC/巴塞罗那超级计算中心,基于BullSequana XH3000系统,采用了英特尔Xeon Platinum 8460Y处理器、NVIDIA H100加速器以及Infiniband NDR200网络连接技术。9、Summit以148.6PFlop/s的HPL性能排名第九。该超算是IBM公司在美国橡树岭国家实验室建造的超级计算机,拥有4356个节点,每个节点配备了两个22核的3.07GHz IBM POWER9 CPU和六个NVIDIA Tesla V100 GPU,每个GPU上集成了80个流式处理器(SM)。10、Eos以121.4PFlop/s的HPL性能排名第十。该超算是英伟达内部使用的 DGX SuperPOD,由Xeon Platinum 8480C 56C 3.8GHz,NVIDIA H100加速器共同驱动,还采用了英伟达Infiniband NDR 400G交换机。对于排名第二的Aurora超算实际测试性能仅1.012 ExaFlop/s,远低于号称性能最高可达2 EFlop/s的问题,阿贡国家实验室的副主任兼杰出研究员Rick Stevens表示,2 exaFLOPS这一数值是基于Aurora核心处理器数量与处理器峰值性能相乘得出的理论峰值,但这并非负责维护和运营Aurora的阿贡系统经理所设定的实际性能目标或期望。Stevens解释说:“峰值性能是一个通过计算得出的理论数字,它基于时钟速率与单个计算元件运算次数的乘积。实际上,典型的系统只能达到这个峰值的一小部分,这取决于它们所执行的任务,通常在50%、60%或70%之间。Aurora上标称的2 exaFlop/s峰值实际上是结合了GPU和CPU的FLOPS得出的。在基准测试中,通常不会这样做。如果查看Top500榜单中其他类似的系统,就会发现它们同样拥有非常大的理论峰值,但实际达到的峰值比例与Aurora类似。因此,这并不是一个根本性的问题。”Stevens表示,Aurora在基准测试中应该能够实现LINPACK性能的提升,因为在最近的基准测试执行时,Aurora的11%计算能力尚未被激活。他预测,当整个系统安装完成之后,将会产生更高的基准测试数据。然而,他拒绝透露阿贡国家实验室对于Aurora在完全运行状态下的具体性能目标数字。根据HPC-AI行业分析机构Hyperion Research公司的首席执行官Earl Joseph的预计,随着时间的推移和系统的进一步调优,Aurora最终将会超过1.5 exaFlop/s。中国不再参加Top500的HPL基准测试在中国的国家级超算去年跌出Top500榜单前十之后,依然无缘于最新的前十榜单。在去年的榜单上,中国的神威·太湖之光和天河二号A也进入了前十五,分别排名第11和第14位。Top500组织在最新发布的报告中指出,中国已决定不再参加Top500的HPL基准测试。在最新的Top500名单中,美国依然是拥有超级计算机数量最多的国家。美国在其之前的基础上新增了7台超级计算机,使得其总数达到了168台。而中国则从104台减少到了80台。Top500组织表示,“事实上,中国在这份新名单上并未报告任何新加入的超级计算机。”从大的区域变化来看,北美地区依然保持领先地位,从上一份榜单的160台系统增加到171台。而亚洲地区则出现了下滑,从169台系统减少到148台。与此同时,欧洲地区实现了显著的增长,从143台增加到160台,位列北美地区之后,成为了全球第二大超级计算机分布区域。英特尔拿下63%的处理器份额Top500组织表示,此次前500强的超算当中,采用英特尔CPU的占比依然是高达63.00%,虽然低于六个月前的67.80%。相比之下,前500强超算当中,有156个系统(31.20%)使用的AMD处理器,高于六个月前的28.00%。另外,还有194个超算系统使用了加速器/协处理器技术,高于六个月前的185个。其中有83个使用了NVIDIA Ampere GPU,48个使用NVIDIA Volta GPU。从总算力来看,所有Top500超算的的总综合性能从6个月前的7.01 ExaFlop/s(EFlop/s)提高到现在的8.21 ExaFlop/s。Top100的性能门槛达到了9.44 PFlop/s。从核心数量来看,TOP500超算的平均并发级别达到了每个系统229426个内核,高于六个月前的212027个。Green 500超算今年的超级计算机Green500榜单也有了显著的变化,前三名的绿色超级计算机均为新上榜者。排名第一的是JEDI–JUPITER Exascale Development Instrument,这台超级计算机由德国的EuroHPC/FZJ开发。在TOP500超级计算机排名中,JEDI位列第190位,展现出了不俗的性能实力。其能效评级高达72.73GFlop/W,HPL得分为4.5 PFlop/s。JEDI是一款配备NVIDIA Grace Hopper Superchip 72C的BullSequana XH3000架构的超级计算,总共有19584个核心处理器。英国布里斯托尔大学的Isambard-AI以68.83 GFlop/W能效评级和7.42 PFLop/s的HPL得分位居第二。Isambard-AI在TOP500中排名第129位,拥有34,272个核心处理器。排名第三的是来自波兰Cyfronet的Helios system。该机器的能效得分为66.95GFlop/W HPL得分为19.14 PFlop/s。Top500组织在讨论能源效率时,还特别提到了Top500榜单第一的Frontier系统。Frontier系统取得了1.206EFlop/s的HPL成绩,这一成绩证明了其优秀的计算能力。同时,Frontier在能源效率方面也表现出色,获得了56.97GFlop/W的分数。这使得Frontier在Green500榜单中排名第11位。 ... PC版: 手机版:

封面图片

蚂蚁集团开源高性能图数据库 TuGraph,成立图计算开源委员会

蚂蚁集团开源高性能图数据库 TuGraph,成立图计算开源委员会 图数据库领域权威测试世界纪录保持者,蚂蚁图数据库 TuGraph 宣布开源。 9 月 1 日,2022 世界人工智能大会“新一代图智能技术发展与实践论坛”上,蚂蚁集团图计算负责人陈文光宣布开源蚂蚁集团高性能图数据库 TuGraph 单机版,并成立图计算开源技术委员会,中国工程院院士郑纬民、陈纯分别担任主席、副主席,5 位业界知名专家担任委员 TuGraph 由蚂蚁集团和清华大学共同研发,是图数据库权威测试世界纪录保持者,也是世界上有测试纪录的“最快”的图数据库。随着 TuGraph 的开源,图数据领域将迎来一款性能卓越、功能丰富、生态完备的开源产品。开发者可以聚焦应用层,轻松打造属于自己的图数据,从而提升行业整体技术应用水位。TuGraph 开源采用 Apache2.0 协议,在 Github 和 Gitee 上进行托管。 图数据库区别于关系型数据库,基于图模型,使用点边来表示、存储、处理数据,拥有灵活的数据抽象模型,能够更好地表达出“关系”的概念。 蚂蚁 TuGraph 是一套分布式图数据库系统,可以支持万亿级边上的实时查询。此次开源的 TuGraph 单机版,同样具备完备的图数据库基础功能和成熟的产品设计,可以轻松支持 TB 级别数据和百亿级别大图,足以满足大多数业务场景需求。相较于市场上常见的开源产品,TuGraph 单机版的性能高 10 倍以上。 ... 来自:雷锋 频道:@kejiqu 群组:@kejiquchat 投稿:@kejiqubot

封面图片

第 59 届 ISC 2022 国际超算大会发布 TOP500 榜单。

第 59 届 ISC 2022 国际超算大会发布 TOP500 榜单。 美国田纳西州橡树岭国家实验室(ORNL)的 Frontier 突破 Exascale 大关,达到 1.102 exaflops 的算力。 Frontier 超级计算机由 74 个 Cray EX 机柜组成,容纳 9408 个节点。 每个节点配备一块 AMD Milan 7A53 Epyc CPU 和 4 块 AMD Instinct MI250X GPU,即总共 9408 CPU + 37632 GPU。 连接方式为 HPE Slingshot-11,每个节点支持 512GB DDR4 内存,跨节点支持 512GB HMB2e(4x 128GB/GPU)内存。 Frontier 性能已经超过了 2-8 名 TOP500 计算机的算力总和,占地 372 平米。 TOP500 排名为: - Frontier,美国 - Fugaku 富岳,日本 - LUMI,芬兰 - Summit,美国(IBM) - Sierra,美国(IBM) - 天河 1A,中国 - Perlmutter HPE Cray EX,美国(NERSC) - Selene,美国(NVIDIA) - 天河 2A,中国 - Adastra,法国 其中,Frontier,LUMI 和 Adastra 均采用了 HPE Cray EX235a 架构。 本次新增的 TOP500 系统中,美国新增 9 个,德国 5 个,中国十年来首次没有新系统上榜。 中国仍然具有榜单上最多的超算,达到 173 个,美国以 127 个屈居第二。 中国超级计算机计划的 E 级超算中,规划中的神威太湖之光与天河三号并没有出现,上海交大 HPC 专家林新华表示,TOP 500 成为了事实上的实体名单,不参与排名能更好地与同行们保持正常联系。

封面图片

图灵奖揭晓:史上首位数学和计算机最高奖“双料王”出现了

图灵奖揭晓:史上首位数学和计算机最高奖“双料王”出现了 加上2021年获得的阿贝尔奖,维格森教授现在一举成为首个同时拿下数学和计算机最高奖的科学家。(阿贝尔奖也被誉为“数学界诺贝尔奖”)。此外,他还是2017年阿里达摩院刚成立时首批“十大祖师”之一。业内人士纷纷赶来表示祝贺,a16z的研发主管表示:除了已有的学术成果外,也是因为他几十年来孜孜不倦的领导力,才带来理论计算机科学界的长青与活力。比如,没有他,可能就不会有西蒙斯计算理论研究所。值得一提的是,他还在5个月前来到清华叉院做客,对当下大语言模型的发展表达了自己的看法。复杂性理论先驱荣获图灵奖作为一名数学家和计算机科学家,维格森最重要的贡献就是增强了人类对计算中随机性和伪随机性作用的理解。具体什么意思?20实际70年代末,计算机科学家们已经发现:随机性和计算难度之间存在显著联系。(这里的计算难度之高指的是那些没有有效算法,即无法在合理的时间内解决的自然问题,它们计算起来比较困难。)通俗一点解释就是:对于许多难题,采用随机性的算法(也称为概率算法)可以远远胜过其确定性方案。例如,在一个被称为“1977证明”的实现中,两位科学家就引入了一种随机算法,可以比当时最好的确定性算法更快地确定一个数字是否为素数。而在20世纪80年代初,维格森与UC伯克利的科学家Richard Karp合作,将随机性的概念与那些被认为计算难度高的问题联系起来,也就是没有已知的确定性算法可以在合理的时间内解决这些问题的问题。尽管不知道如何证明它们很难,维格森和Richard Karp还是发现了一种针对某个难题的随机算法,然后发现:能够将其去随机化,从而有效地揭示了它的确定性算法。大约在同一时间,其他研究人员也发现密码学问题中的计算难度假设能够实现一般的去随机化。这促使维格森思考随机性本身的特质。他和其他人一样,开始质疑随机性在高效问题解决中的必要性以及在什么条件下它可以完全被消除。终于,1994年,他和另一位计算机科学家Noam Nisan阐明了两者之间的联系。他们证明,如果存在任何自然难题,那么每一种有效的随机算法都可以被有效的确定性算法所取代。即我们总是可以消除随机性。更重要的是,他们还发现确定性算法可能使用“伪随机”序列也就是看似随机但实际上并非随机的数据串。换句话总结就是:随机性对于高效计算来说并不是必需的。即使在没有随机性的情况下,我们仍然可以使用有效的算法来解决问题。这一系列研究彻底改变了计算机科学家对随机性的看法,并适用于理论计算机科学的许多领域。今天,ACM就将图灵奖这一重要荣誉颁给了维格森,主要嘉奖的就是他在如上领域的贡献。在普林斯顿高等研究院的采访中,维格森解释自己既是一位数学家也是一位计算机理论科学家,研究的是计算领域的数学基础。我的研究领域是数学的一个子域,但同时,我所研究的主要概念是计算。对于理论计算机科学,他则认为这个学科拥有一个人对学术研究所能期望的所有优点,包含了一系列令人惊叹的深刻且具有重要智力意义的基本问题,而这些问题对人类、科学、生活和技术都至关重要。(看得出老爷子满满的热爱之情了。)而对于本次大奖,维格森则表示:自己很高兴看到ACM再次认可计算基础理论,它确实对计算科学的实践和技术发展做出了巨大贡献。大学被劝学计算机“好找工作”维格森于1956年在以色列出生,是一位护士和一名电气工程师的儿子。他的父亲喜欢拼图,并对数学的基本概念非常感兴趣,然后又经常跟孩子们分享他的想法。维格森这样描述父亲对他的潜移默化的影响:就是他让我感染了这种病毒。不过等他要在当地海法大学上学时,本想主修数学的他,却被他的父母劝导说:选择计算机吧,计算机好找工作!结果他发现这个领域有很多数学问题没有解决,于是开始吭哧吭哧解决了起来。维格森毕业于以色列理工学院和美国普林斯顿大学,1983 年凭借论文《组合复杂性的研究》获得博士学位。他早期的一项开创性工作,就是证明了一个看似矛盾的问题:能不能在不展示证明过程的情况下,让别人相信一个数学论断已经被证明了。是不是想起隐私计算领域姚期智提出的百万富翁问题内味了。那个问题就是两个百万富翁,他们想证明谁更富有,但两个人都不透露他们拥有多少财富。而原本的这个问题其实是叫做零知识证明,这个概念最早在1985年由三位科学家引入。随后由维格森以及他的合作伙伴Micali和Oded Goldreich进一步阐述了这一想法,并发现了一个意想不到的结果:如果真正安全加密是可能的,那么 NP 中每个问题的解也都可以用零知识证明来证明。换言之,零知识证明可以用于秘密地证明任何有关秘密数据的公开结果。数十年来,他始终活跃在学术岗位上,并且获得诸多赞誉和奖项。1994年,他因在计算复杂性理论方面的工作获得1994年的内万林纳博士毕业后,他在加州大学伯克利分校担任客座助理教授,在IBM担任访问科学家,并在伯克利的数学科学研究所担任研究员。1986年加入希伯来大学担任教员。1994年,他与Omer Reingold和Salil Vadhan一起因在图的 zig-zag 乘积方面的工作而获得了 2009 年哥德尔奖。1999年,他加入普林斯顿高等研究院并工作至今。2013年当选美国国家科学院院士。2018年,他因对计算机科学和数学理论的贡献当选ACM Fellow。第二年,又因为“在随机计算、密码学、电路复杂性、证明复杂性、并行计算以及我们对基本图特性的理解等领域对计算机科学基础做出的根本性和持久性贡献”,他荣获高德纳奖。2021年,维格森与László Lovász共同获得阿贝尔奖。也正因为这样根本性且持久性的贡献,网友们得知他才获图灵奖时感到意外而又惊喜,还以为他早就得了。也有人开始看他曾经写过的书籍了。或许有眼熟的朋友吗?谈大语言模型:最重要还是看它不能做什么而他与姚期智以及中国的缘分还在延续。5个月前,他还曾亲自来到清华叉院做客,带来题为“模仿游戏(Imitation Games)”的特邀报告。由姚期智院士亲自主持讲座,并与他展开对话。据报道,维格森从图灵测试出发,叙述了“模仿学习”理论的沿革及其在密码学、随机性、离散数学、数论等领域的现代应用。他基于凯撒密码、恩尼格玛密码机、选举等案例,引导思考安全性的定义、随机性的应用、隐私和效用的平衡等问题。对于理论计算机研究将如何应对人工智能发展这一问题,维格森表示,尽管包括大语言模型在内的人工智能有很多惊人表现,但最重要的问题是还有什么是AI不能做的。对于给现在正置身于科研的同学们,维格森也给出了自己的建议。他表示,自己曾为解决一个开放性问题用了40年时间,建议同学们要选择自己喜欢的研究领域和话题,并享受在失败中不断学习的过程,这样才能在科研道路上走得长远。参考链接:[1] ... PC版: 手机版:

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人