英伟达发布新一代 AI 芯片 H200

英伟达发布新一代AI芯片H200H200利用了美光等公司推出的HBM3e内存，提供了141GB内存容量(H100的1.8倍)和4.8TB/s内存带宽(H100的1.4倍)。大型语言模型推理速度方面，GPT-3175B是H100的1.6倍(A100的18倍)，LLaMA270B是H100的1.9倍。英伟达同时宣布2024年的H100产量翻倍，2024年第4季度发布基于新一代Blackwell架构的B100。投稿：@ZaiHuaBot频道：@TestFlightCN

在Telegram中查看

相关推荐

英伟达发布下一代AI计算芯片 HGX H200 GPU

英伟达发布下一代AI计算芯片HGXH200GPUNVIDIA今天宣布推出NVIDIAHGX™H200，为全球领先的AI计算平台带来强大动力。该平台基于NVIDIAHopper™架构，配备NVIDIAH200TensorCoreGPU和高级内存，可处理生成AI和高性能计算工作负载的海量数据。NVIDIAH200是首款提供HBM3e的GPU，HBM3e是更快、更大的内存，可加速生成式AI和大型语言模型，同时推进HPC工作负载的科学计算。借助HBM3e，NVIDIAH200以每秒4.8TB的速度提供141GB内存，与前一代NVIDIAA100相比，容量几乎翻倍，带宽增加2.4倍。全球领先的服务器制造商和云服务提供商采用H200的系统预计将于2024年第二季度开始发货。——

英伟达发布新一代数据中心超级芯片

英伟达发布新一代数据中心超级芯片在周二的主题演讲中，黄仁勋介绍了下一代DGXGH200GraceHopper超级芯片，专为OpenAI的ChatGPT等大内存生成性人工智能模型设计，以扩展全球的数据中心。在发布会前的新闻发布会上，英伟达的超大规模和高性能计算部门主管IanBuck告诉记者，GH200比该公司的H100数据中心系统容纳了更多的内存和更大的带宽。GH200采用了英伟达的HopperGPU架构，并将其与ArmLtd.的GraceCPU架构结合起来。该芯片拥有141GB的HBM3内存，以及每秒5TB的带宽。GH200可以在NVLink的双GH200系统中叠加使用，使内存增加3.5倍，带宽增加两倍。这两种产品都将在2024年第二季度上市，但英伟达没有透露定价。——

英伟达最新AI芯片H200或将成为其史上最赚钱产品之一

英伟达最新AI芯片H200或将成为其史上最赚钱产品之一根据英伟达官网的消息，基于英伟达的“Hopper”架构，H200是该公司首款采用HBM3e内存的芯片。这种内存速度更快，容量更大，使其更适用于大型语言模型。英伟达表示，H200使用HBM3e内存能够以每秒4.8TB的速度提供141GB的容量，相比于A100，其容量几乎翻了一倍，带宽提高了2.4倍。预计H200将于2024年第二季度上市，届时将与AMD的MI300XGPU展开竞争。与H200相似，AMD的新芯片相比前代产品拥有更多内存，这对运行大型语言模型的推理计算有帮助。英伟达还表示，H200将与H100兼容，这意味着那些已经在使用H100进行训练的AI公司无需更改他们的服务器系统或软件即可适应H200。英伟达副总裁IanBuck称：“为了训练生成式AI和高性能计算应用，必须使用高性能GPU。有了H200，行业领先的AI超级计算平台可以更快地解决一些世界上最重要的挑战。”英伟达的加速计算首席产品经理DionHarris表示：“观察市场上的动态，可以看到大型模型的尺寸正在迅速扩大。这是我们继续引领最新、最伟大技术的又一例证。”据美国金融机构RaymondJames透露，H100芯片的成本仅为3320美元，但英伟达对其客户的批量价格却高达2.5万至4万美元。这使得H100的利润率可能高达1000%，成为有史以来最赚钱的芯片之一。在训练大型语言模型时，通常需要数千个H100集群协同工作，因此科技巨头、初创公司和政府机构都在争夺英伟达有限的芯片供应。由于对其产品的需求看似无穷无尽，英伟达今年的销售额大幅增长，股价上涨了230%，市值突破了1.2万亿美元大关。截至周一收盘，该股收涨0.59%，报486.2美元。相关文章:NVIDIA发布HopperH200GPU与基于GraceHopper的Jupiter超算项目...PC版：https://www.cnbeta.com.tw/articles/soft/1396697.htm手机版：https://m.cnbeta.com.tw/view/1396697.htm

全球首块英伟达H200 AI超级芯片交付黄仁勋给OpenAI“送货上门”

全球首块英伟达H200AI超级芯片交付黄仁勋给OpenAI“送货上门”H200基于英伟达Hopper架构打造，并配备英伟达H200TensorCoreGPU，处理速度为4.8TB/秒。H200拥有141GB的内存，与前代产品H100相比，H200的容量几乎翻了一番，运行大模型的综合性能相比前代H100提升了60%到90%。英伟达此前表示，H200在运行GPT-3时的性能，将比原始A100高出18倍，同时也比H100快11倍左右。值得一提的是，H200还将与H100兼容，使用H100训练/推理模型的AI企业，可以无缝更换成最新的H200芯片。...PC版：https://www.cnbeta.com.tw/articles/soft/1428557.htm手机版：https://m.cnbeta.com.tw/view/1428557.htm

Nvidia将推出一款新的必备人工智能芯片-H200

Nvidia正在推出一款用于人工智能工作的新一代顶级芯片，即HGXH200。这款新的GPU在广受需求的H100的基础上进行了升级，内存带宽提升了1.4倍，内存容量提升了1.8倍，提高了处理密集生成式人工智能工作的能力。重要的问题是公司是否能够获得这些新芯片，或者它们是否会像H100一样供应不足，对此Nvidia并没有确切的答案。首批H200芯片将于2024年第二季度发布，Nvidia表示正在与“全球系统制造商和云服务提供商”合作，以使其可用。H200在外观上与H100基本相同，除了内存方面有所改变。但是对内存的改变使其升级更有意义。新的GPU是第一个使用名为HBM3e的新型更快内存规格的GPU。这使得GPU的内存带宽从H100的每秒3.35TB提升到每秒4.8TB，并且总内存容量从80GB增加到141GB。H200也被设计为与已经支持H100s的系统兼容。Nvidia表示，云服务提供商在添加H200时不需要进行任何更改。亚马逊、谷歌、微软和甲骨文等云计算服务提供商将是明年首批提供新型GPU的公司。标签:#Nvidia#英伟达频道:@GodlyNews1投稿:@GodlyNewsBot

老黄深夜炸场：世界最强AI芯片H200震撼发布性能飙升90%

老黄深夜炸场：世界最强AI芯片H200震撼发布性能飙升90%全世界的AI公司都陷入算力荒，英伟达的GPU已经千金难求。英伟达此前也表示，两年一发布的架构节奏将转变为一年一发布。就在英伟达宣布这一消息之际，AI公司们正为寻找更多H100而焦头烂额。英伟达的高端芯片价值连城，已经成为贷款的抵押品。谁拥有H100，是硅谷最引人注目的顶级八卦至于H200系统，英伟达表示预计将于明年二季度上市。同在明年，英伟达还会发布基于Blackwell架构的B100，并计划在2024年将H100的产量增加两倍，目标是生产200多万块H100。而在发布会上，英伟达甚至全程没有提任何竞争对手，只是不断强调“英伟达的AI超级计算平台，能够更快地解决世界上一些最重要的挑战。”随着生成式AI的大爆炸，需求只会更大，而且，这还没算上H200呢。赢麻了，老黄真的赢麻了！141GB超大显存，性能直接翻倍！H200，将为全球领先的AI计算平台增添动力。它基于Hopper架构，配备英伟达H200TensorCoreGPU和先进的显存，因此可以为生成式AI和高性能计算工作负载处理海量数据。英伟达H200是首款采用HBM3e的GPU，拥有高达141GB的显存。与A100相比，H200的容量几乎翻了一番，带宽也增加了2.4倍。与H100相比，H200的带宽则从3.35TB/s增加到了4.8TB/s。英伟达大规模与高性能计算副总裁IanBuck表示——要利用生成式人工智能和高性能计算应用创造智能，必须使用大型、快速的GPU显存，来高速高效地处理海量数据。借助H200，业界领先的端到端人工智能超算平台的速度会变得更快，一些世界上最重要的挑战，都可以被解决。Llama2推理速度提升近100%跟前代架构相比，Hopper架构已经实现了前所未有的性能飞跃，而H100持续的升级，和TensorRT-LLM强大的开源库，都在不断提高性能标准。H200的发布，让性能飞跃又升了一级，直接让Llama270B模型的推理速度比H100提高近一倍！H200基于与H100相同的Hopper架构。这就意味着，除了新的显存功能外，H200还具有与H100相同的功能，例如TransformerEngine，它可以加速基于Transformer架构的LLM和其他深度学习模型。HGXH200采用英伟达NVLink和NVSwitch高速互连技术，8路HGXH200可提供超过32Petaflops的FP8深度学习计算能力和1.1TB的超高显存带宽。当用H200代替H100，与英伟达GraceCPU搭配使用时，就组成了性能更加强劲的GH200GraceHopper超级芯片——专为大型HPC和AI应用而设计的计算模块。下面我们就来具体看看，相较于H100，H200的性能提升到底体现在哪些地方。首先，H200的性能提升最主要体现在大模型的推理性能表现上。如上所说，在处理Llama2等大语言模型时，H200的推理速度比H100提高了接近1倍。因为计算核心更新幅度不大，如果以训练175B大小的GPT-3为例，性能提升大概在10%左右。显存带宽对于高性能计算（HPC）应用程序至关重要，因为它可以实现更快的数据传输，减少复杂任务的处理瓶颈。对于模拟、科学研究和人工智能等显存密集型HPC应用，H200更高的显存带宽可确保高效地访问和操作数据，与CPU相比，获得结果的时间最多可加快110倍。相较于H100，H200在处理高性能计算的应用程序上也有20%以上的提升。而对于用户来说非常重要的推理能耗，H200相比H100直接腰斩。这样，H200能大幅降低用户的使用成本，继续让用户“买的越多，省的越多”！上个月，外媒SemiAnalysis曾曝出一份英伟达未来几年的硬件路线图，包括万众瞩目的H200、B100和“X100”GPU。而英伟达官方，也公布了官方的产品路线图，将使用同一构架设计三款芯片，在明年和后年会继续推出B100和X100。B100，性能已经望不到头了这次，英伟达更是在官方公告中宣布了全新的H200和B100，将过去数据中心芯片两年一更新的速率直接翻倍。以推理1750亿参数的GPT-3为例，今年刚发布的H100是前代A100性能的11倍，明年即将上市的H200相对于H100则有超过60%的提升，而再之后的B100，性能更是望不到头。至此，H100也成为了目前在位最短的“旗舰级”GPU。如果说H100现在就是科技行业的“黄金”，那么英伟达又成功制造了“铂金”和“钻石”。H200加持，新一代AI超算中心大批来袭云服务方面，除了英伟达自己投资的CoreWeave、Lambda和Vultr之外，亚马逊云科技、Google云、微软Azure和甲骨文云基础设施，都将成为首批部署基于H200实例的供应商。此外，在新的H200加持之下，GH200超级芯片也将为全球各地的超级计算中心提供总计约200Exaflops的AI算力，用以推动科学创新。在SC23大会上，多家顶级超算中心纷纷宣布，即将使用GH200系统构建自己的超级计算机。德国尤里希超级计算中心将在超算JUPITER中使用GH200超级芯片。这台超级计算机将成为欧洲第一台超大规模超级计算机，是欧洲高性能计算联合项目（EuroHPCJointUndertaking）的一部分。Jupiter超级计算机基于Eviden的BullSequanaXH3000，采用全液冷架构。它总共拥有24000个英伟达GH200GraceHopper超级芯片，通过Quantum-2Infiniband互联。每个GraceCPU包含288个Neoverse内核，Jupiter的CPU就有近700万个ARM核心。它能提供93Exaflops的低精度AI算力和1Exaflop的高精度（FP64）算力。这台超级计算机预计将于2024年安装完毕。由筑波大学和东京大学共同成立的日本先进高性能计算联合中心，将在下一代超级计算机中采用英伟达GH200GraceHopper超级芯片构建。作为世界最大超算中心之一的德克萨斯高级计算中心，也将采用英伟达的GH200构建超级计算机Vista。伊利诺伊大学香槟分校的美国国家超级计算应用中心，将利用英伟达GH200超级芯片来构建他们的超算DeltaAI，把AI计算能力提高两倍。此外，布里斯托大学将在英国政府的资助下，负责建造英国最强大的超级计算机Isambard-AI——将配备5000多颗英伟达GH200超级芯片，提供21Exaflops的AI计算能力。英伟达、AMD、英特尔：三巨头决战AI芯片GPU竞赛，也进入了白热化。面对H200，而老对手AMD的计划是，利用即将推出的大杀器——InstinctMI300X来提升显存性能。MI300X将配备192GB的HBM3和5.2TB/s的显存带宽，这将使其在容量和带宽上远超H200。而英特尔也摩拳擦掌，计划提升GaudiAI芯片的HBM容量，并表示明年推出的第三代GaudiAI芯片将从上一代的96GBHBM2e增加到144GB。英特尔Max系列目前的HBM2容量最高为128GB，英特尔计划在未来几代产品中，还要增加Max系列芯片的容量。H200价格未知所以，H200卖多少钱？英伟达暂时还未公布。要知道，一块H100的售价，在25000美元到40000美元之间。训练AI模型，至少需要数千块。此前，AI社区曾广为流传这张图片《我们需要多少个GPU》。GPT-4大约是在10000-25000块A100上训练的；Meta需要大约21000块A100；StabilityAI用了大概5000块A100；Falcon-40B的训练，用了384块A100。根据马斯克的说法，GPT-5可能需要30000-50000块H100。摩根士丹利的说法是25000个GPU。SamAltman否认了在训练GPT-5，但却提过“OpenAI的GPU严重短缺，使用我们产品的人越少越好”。我们能知道的是，等到明年第二季度H200上市，届时必将引发新的风暴。...PC版：https://www.cnbeta.com.tw/articles/soft/1396699.htm手机版：https://m.cnbeta.com.tw/view/1396699.htm

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人