每秒40亿亿次 俄罗斯最强AI超算“MSU-270”上线

每秒40亿亿次俄罗斯最强AI超算“MSU-270”上线俄罗斯并没有自己的高端计算GPU,大概率来自外部供应,但是NVIDIA、AMD、Intel都不能向俄罗斯出口此类产品,外媒就想到了中国厂商,比如一度号称比肩NVIDIA的壁仞科技。在此之前,MSU使用的GPU加速器都来自NVIDIA。MSU-27040亿亿次计算的性能单指AI方向,也就是FP16半精度浮点格式。目前,俄罗斯最强的通用计算超算最大性能只有21.5PFlops,也就是2.15亿亿次FP64双精度浮点计算每秒。除了AI,MSU-270还可广泛用于各种科学领域的研究,包括物理学、化学、生物学、心理学、社会学、地质学、医学等等。...PC版:https://www.cnbeta.com.tw/articles/soft/1381369.htm手机版:https://m.cnbeta.com.tw/view/1381369.htm

相关推荐

封面图片

【AI World完成第二次算力集群扩充】

【AIWorld完成第二次算力集群扩充】2023年08月14日11点01分8月14日消息,据官方消息,AIWorld算力网络已经完成第二次硬件扩充,主力为NVIDIAA100与NVIDIAH100专业卡,全新加入的H100使双精度TensorCore的每秒浮点运算(FLOPS)提升3倍,为HPC提供60teraFLOPS的FP64浮点运算。融合AI的高性能计算应用可以利用H100的TF32精度实现1petaFLOP的吞吐量,从而在不更改代码的情况下,实现单精度矩阵乘法运算。

封面图片

追赶NVIDIA!国产顶级AI GPU亮相:算力达160万亿次

追赶NVIDIA!国产顶级AIGPU亮相:算力达160万亿次曦思N100是一款面向云端数据中心应用的AI推理GPU加速卡,内置异构GPGPU通用计算核心“MXN100”,并集成HBM2E高带宽内存,单卡的INT8整数算力达160TOPS(160万亿次每秒),FP16浮点算力则达80TFLOPS(80万亿次每秒),兼备高带宽、低延时。曦思N100已实现规模量产,可广泛应用于智慧城市、智慧安防、智慧交通、云计算、智能视频处理等场景。沐曦产品均采用完全自主研发的GPUIP,拥有完全自主的指令集和架构,配以兼容主流GPU生态的完整软件栈(MXMACA),具备高能效和高通用性的优势。投稿:@ZaiHuaBot频道:@TestFlightCN

封面图片

AMD为美国打造200亿亿次超算 1460亿晶体管超级APU开始安装

AMD为美国打造200亿亿次超算1460亿晶体管超级APU开始安装目前(公开)世界第一超算是“Frontier”,隶属于美国能源部橡树岭国家实验室,最大性能每秒119亿亿次,峰值性能168亿亿次,采用AMD第三代霄龙7A5364核心处理器、InstinctMI250XGPU加速器。Intel则在联合美国能源部阿贡国家实验室打造“Aurora”,采用AMD第四代至强Max处理器、PonteVecchioMaxGPU加速器,预计性能超过200亿亿次,现已完成安装,并转入调试阶段。ElCapitan采用了代号Genoa、Zen4架构的AMD第四代霄龙处理器,搭档InstinctMI300A加速器,并借鉴Frontier超算中的各种定制改进技术,针对AI、HPC负载而优化,在数据分析方面实现飞跃,从而能够创建更快速、更准确并且能够量化预测不确定性的模型。InstinctMI300A是全球首款面向HPC、AI的APU加速器,集成多达13颗小芯片,包括nm工艺的24个Zen4CPU核心、CDNA3GPU核心、128GBHBM3内存,还有6nm工艺的中介层,整体晶体管数量多达1460亿个。ElCapitan超级计算机,也是InstinctMI300A加速器的第一个客户项目。同时,AMD还在打造InstinctMI300X,就是将MI300A里的CPU部分也替换成GPU,同时升级192GBHBM3E,晶体管增加到1530亿个,第三季度出样。MI300X...PC版:https://www.cnbeta.com.tw/articles/soft/1369389.htm手机版:https://m.cnbeta.com.tw/view/1369389.htm

封面图片

国内第一算力通用GPU芯片集成770亿晶体管 一次点亮成功

国内第一算力通用GPU芯片集成770亿晶体管一次点亮成功8月9日下午,国内科技创新企业壁仞科技(Birentech)正式发布BR100系列通用计算GPU,号称算力国内第一,多向指标媲美设置超越国际旗舰产品。根据介绍,壁仞科技BR100芯片采用台积电7nm工艺制造、2.5DCoWoS封装技术、Chiplet小芯片技术,集成了多达770亿晶体管,规模上堪比人类大脑神经细胞,已经非常接近800亿个晶体管的NVIDIAGH100计算核心。性能方面,INT8整数计算2048Tops(每秒2048万亿次)、BF16浮点计算1024TFlops(每秒1024万亿次)、TF32+浮点计算512TFlops(每秒512万亿次)、FP32双精度浮点256TFlops(每秒256万亿次)。其他方面,它还集成了超过300MB片上缓存、64GBHBM2E片上内存,外部IO带宽达2.3TB/s,支持64路编码、512路解码,还支持PCIe5.0、CXL互连协议,一次全部给到位。更难得的是,壁仞科技创始人、董事长、CEO张文在发布会上披露,BR100系列芯片一次就点亮成功了!我们知道,芯片设计是一个漫长复杂的过程,最为关键的就是流片,一旦失败就要推倒重来,即便是Intel、NVIDIA、AMD这些顶级巨头也不能保证一次完成,壁仞科技如此庞大规模、顶级算力的设计一次就搞定,属实难得。PC版:https://www.cnbeta.com/articles/soft/1302535.htm手机版:https://m.cnbeta.com/view/1302535.htm

封面图片

NVIDIA发布AI超算DGX GH200:144TB内存、1.8万核CPU

NVIDIA发布AI超算DGXGH200:144TB内存、1.8万核CPUAI运算对内存容量的要求更高,所以DGXGH200通过最新的NVLink、NVLinkSwitch等技术连接了256块GraceHooper超级芯片,实现了极为夸张的性能及内存。GraceHooper我们之前报道过,这是一块CPU+GPU合体的超级芯片,CPU是NVIDIA自研的72核处理器,NeoverseV2内核,拥有480GBLPDDR5内存,512GB/s带宽。GPU部分是H100,FP64性能34TFLOPS,但更强的是INT8性能,AI运算能力达到了3958TFLOPS,带96GBHBM3内存。GH200总计有256块GraceHooper芯片,因此总计18432个CPU核心,144TBHBM3内存,AI性能达到了1exaFLOPS,也就是100亿亿次。这是什么概念,当前最强的TOP500超算也就是百亿亿次性能,只不过这个性能是HPC计算的,NVIDIA的是百亿亿次AI性能。为了让256个超级芯片互联,GH200还使用了256块单口400Gb/sInfiniBand互联芯片,256个双口200Gb/sInfiniBand芯片,还有96组L1NVLink、36组L2NVLink开关等等,设计非常复杂。NVIDIA表示,谷歌、Meta及微软是首批获得DGXH200系统的公司,后续他们还会开放给更多客户,运行客户定制。不过DGXH200还不是最强的,NVIDIA今年晚些时候会推出名为NVIDIAHelios的AI超算系统,由4组GH200组成,总计1024个GraceHooper超级芯片,576TBHBM内存。...PC版:https://www.cnbeta.com.tw/articles/soft/1362277.htm手机版:https://m.cnbeta.com.tw/view/1362277.htm

封面图片

AMD超算全球四连冠 性能第一还特省电

AMD超算全球四连冠性能第一还特省电AMDEPYC7A5364核心处理器、InstinctMI250XGPU加速器组成的顶级超算“Frontier”继续稳居榜首,并实现了霸气的四连冠,依然是迄今唯一一套公开的完全通过验证并投入实用的百亿亿次级超算。图源:AMD2022年6月,Frontier系统首次拿下世界第一,最大浮点性能1102PFlops(每秒110.2亿亿次),相比前冠军日本Fugaku高出了足足50%,甚至超过了当时第二名到第七名的总和。当时,Frontier系统拥有8730112个核心,后来调整减少到8699904个核心,但是经过同步优化,最大性能反而提升了8%而达到1194PFlops(每秒119.4亿亿次),峰值性能为1679.8PFlops(167.98亿亿次)。Frontier对比本届榜单上的第二名,IntelCPU+GPU平台的“Aurora”,性能领先了整整一倍,后者最大性能仅为585.34PFlops(每秒58.534亿亿次),远远没有摸到百亿亿次计算的门槛。事实上,第二名Aurora和第三名Eagle的计算性能加起来,相比于Frontier也还差了47.46PFlops(每秒4.746亿亿次),第二名Aurora的功耗反而还比Frontier高了一丢丢。可以说,Frontier真正做到了“遥遥领先”。值得一提的是,在更关注系统级性能的HPCG测试中,Frontier继续位列第二名,成绩为14.05HPCG-TFops,和第一名差距极小,同时相当于第三名的整整3倍。事实上,HPCG榜单上第三名的“LUMI”作为欧洲第一、世界第三超算,使用的也是AMD第三代EPYC64核心处理器、InstinctMI250X加速器的组合,最大性能379.7PFlops(每秒37.97亿亿次)。更难得的是,AMD平台超算在性能强劲的同时,能效更加突出。同步发布的Green500绿色超算榜单上,TOP10里有8套都是基于AMD平台,比去年又增加了1套。其中,FrontierTDS测试系统高居第二,每瓦性能达到62.684GFlops(每秒626.84亿次),而且和第一名Henri的差距只有区区4%。完整的Frontier系统也排在第八名。可以说,在对高性能算力需求越来越高的今天,在全人类高度重视绿色环保、可持续发展的今天,能效的重要性日益凸显。AMD也设定了雄伟的“30x25”目标,目标是到2025年,AI/HPC平台的能效要比2020年提到足足30倍。AMD超算系统优秀的能效表现,正是实现这一目标的切实行动体现。最后,另一套基于AMD平台的百亿亿次超算“ElCapitan”,也已经开始组装,使用的加速器是AMDInstinctMI300A,全球第一款单封装整合CPU、GPU、HBM高带宽内存的数据中心APU。它完工并正式上线之后,预计可提供超过2EFlops的双精度浮点性能,也就是二百亿亿次!目前,HPECraySupercomputingEX255a、EvidenBullSequanaXH3000高性能计算平台,都已引入Instinct300A。...PC版:https://www.cnbeta.com.tw/articles/soft/1397205.htm手机版:https://m.cnbeta.com.tw/view/1397205.htm

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人