NVIDIA Blackwell GPU的后继型号为"Rubin" 将于2025年底推出

NVIDIA Blackwell GPU的后继型号为"Rubin" 将于2025年底推出 访问:Saily - 使用eSIM实现手机全球数据漫游 安全可靠 源自NordVPN 这一点将变得尤为重要,因为英伟达目前的架构已经接近千瓦级,这样下去计算中心将无法无限制地扩展。天风国际证券分析师郭明𫓹(Mich-Chi Kuo)表示,英伟达基于"Rubin"的首款AI GPUR100预计将于2025年第四季度进入量产,这意味着它可能会在更早的时间内亮相和展示;而部分客户可能会更早地获得芯片,以便进行评估。根据郭明𫓹(Mich-Chi Kuo)的说法,R100 预计将采用台积电的 3 纳米 EUV FinFET 工艺,特别是台积电-N3 节点。相比之下,新的"Blackwell"B100 使用的是 TSMC-N4P。这将是一款芯片级 GPU,采用 4 倍光罩设计(Blackwell 采用 3.3 倍网罩),并与 B100 一样使用台积电的 CoWoS-L 封装。预计该芯片将成为 HBM4 堆叠内存的首批客户之一,具有 8 个堆叠,堆叠高度尚不清楚。Grace Ruben GR200 CPU+GPU 组合可能采用在 3 纳米节点上制造的全新"Grace"CPU,很可能采用光学收缩技术以降低功耗。2025 年第四季度的量产路线图目标意味着客户将在 2026 年初开始收到这些芯片。 ... PC版: 手机版:

相关推荐

封面图片

NVIDIA“最强AI芯片”Blackwell B200 GPU令业内惊呼新的摩尔定律诞生

NVIDIA“最强AI芯片”Blackwell B200 GPU令业内惊呼新的摩尔定律诞生 在GTC直播中,黄仁勋左手举着 B200 GPU,右手举着 H100此外,将两个B200 GPU与单个Grace CPU 结合在一起的 GB200,可以为LLM推理工作负载提供30倍的性能,并且显著提高效率。黄仁勋还强调称:“与H100相比,GB200的成本和能耗降低了25倍!关于市场近期颇为关注的能源消耗问题,B200 GPU也交出了最新的答卷。黄仁勋表示,此前训练一个1.8 万亿参数模型,需要8000 个 Hopper GPU 并消耗15 MW电力。但如今,2000 个 Blackwell GPU就可以实现这一目标,耗电量仅为4MW。在拥有1750亿参数的GPT-3大模型基准测试中,GB200的性能是H100的7倍,训练速度是H100的4倍。值得一提的是,B200 GPU的重要进步之一,是采用了第二代Transformer引擎。它通过对每个神经元使用4位(20 petaflops FP4)而不是8位,直接将计算能力、带宽和模型参数规模翻了一倍。而只有当这些大量的GPU连接在一起时,第二个重要区别才会显现,那就是新一代NVLink交换机可以让576个GPU相互通信,双向带宽高达1.8TB/秒。而这就需要英伟达构建一个全新的网络交换芯片,其中包括500亿个晶体管和一些自己的板载计算:拥有3.6 teraflops FP8处理能力。在此之前,仅16个GPU组成的集群,就会耗费60%的时间用于相互通信,只有40%的时间能用于实际计算。一石激起千层浪,“最强AI芯片”的推出让网友纷纷赞叹。其中英伟达高级科学家Jim Fan直呼:Blackwell新王诞生,新的摩尔定律已经应运而生。DGX Grace-Blackwell GB200:单个机架的计算能力超过1 Exaflop。黄仁勋交付给OpenAI的第一台DGX是0.17 Petaflops。GPT-4的1.8T参数可在2000个Blackwell上完成90天的训练。还有网友感叹:1000倍成就达成!Blackwell标志着在短短8年内,NVIDIA AI 芯片的计算能力实现了提升1000倍的历史性成就。2016 年,“Pascal”芯片的计算能力仅为19 teraflops,而今天Blackwell的计算能力已经达到了 20000 teraflops。相关文章:全程回顾黄仁勋GTC演讲:Blackwell架构B200芯片登场英伟达扩大与中国车企合作 为比亚迪提供下一代车载芯片英伟达进军机器人领域 发布世界首款人形机器人通用基础模型台积电、新思科技首次采用NVIDIA计算光刻平台:最快加速60倍NVIDIA共享虚拟现实环境技术将应用于苹果Vision Pro黄仁勋GTC演讲全文:最强AI芯片Blackwell问世 推理能力提升30倍 ... PC版: 手机版:

封面图片

NVIDIA Blackwell GPU预计售价3.5万美元 AI服务器售价高达300万美元

NVIDIA Blackwell GPU预计售价3.5万美元 AI服务器售价高达300万美元 NVIDIA 的 Blackwell 产品包括 GPU、超级芯片平台和服务器,是每一家热衷于人工智能的大型科技公司所梦寐以求的。来自汇丰银行的分析师披露了即将推出的组件的预期定价,英伟达的 Blackwell AI 服务器机架这次的价格不菲,将超过 300 万美元大关,B100 GPU 等 AI 加速器单卖的标价也很高。这一消息来自《巴伦周刊》(Barron's)的资深撰稿人@firstadopter引用了汇丰银行(HSBC)对英伟达(NVIDIA)Blackwell产品的分析。从人工智能服务器开始,英伟达 GB200 NVL36 服务器机架的单台售价预计为 180 万美元,而更高级的 NVL72 对应产品的售价则高达 300 万美元。我们在之前的报道中也透露了这一具体数额,因此实际数字可能不会太远。关于单卖的人工智能加速卡,汇丰银行表示,单个 B100 人工智能 GPU 的售价预计约为 3 万至 3.5 万美元,而GB200 超级芯片的单价约为 6 万至 7 万美元。这些超级芯片包含两个 GB100 GPU 和一个 Grace Hopper 芯片,以及一个大型系统内存池(HBM3E)。这些估价也与詹森本人透露的价格基本一致。分析师的估算可能没有考虑实时市场情况、采购量和许多其他因素。因此,根据买家类型和订单的严重程度,实际数字可能会更低甚至更高。现在,如果我们从代际上进行比较,Blackwell 价格肯定要比 Hopper 高。如果 Blackwell AI GPU 架构能够复制 Hopper GPU 的成功应用,那么英伟达的市场份额和主导地位又将会有质的飞跃。谁知道呢,也许它将超越苹果和微软等公司,成为全球最有价值的公司之一。到目前为止,我们已经看到Meta 等公司下达了 Blackwell 订单,微软和 OpenAI 也在其中,而这仅仅是首批订单。NVIDIA公司首席执行官黄仁勋(Jensen Huang)早早识别出人工智能热潮的大手笔确实收到了成效。 ... PC版: 手机版:

封面图片

戴尔透露 NVIDIA B100 将于今年推出,2025年将升级到 B200

戴尔透露 NVIDIA B100 将于今年推出,2025年将升级到 B200 在最近的财报电话会议上,戴尔透露了 NVIDIA 的下一代 Blackwell 系列不仅将拥有 B100 AI 加速卡,而且稍后将提供升级版本 B200 。看起来NVIDIA似乎已经向戴尔等最大的合作伙伴披露了这些信息,戴尔将使用NVIDIA最新的AI和计算硬件来运营服务器和数据中心。 戴尔高级副总裁还指出,NVIDIA B100 和 B200 等下一代 GPU 的功率密度将达到 1000W。当前 NVIDIA H200 和 AMD MI300X 加速卡的峰值功率已经达到 800W,因此考虑到 Blackwell 预计将带来的性能提升,考虑到其效率的提高,功率增加 200W 将是相当正常的。

封面图片

NVIDIA官宣全新Rubin GPU、Vera CPU 3nm工艺配下代HBM4内存

NVIDIA官宣全新Rubin GPU、Vera CPU 3nm工艺配下代HBM4内存 NVIDIA现有的高性能GPU架构代号“Blackwell”,已经投产,相关产品今年陆续上市,包括用于HPC/AI领域的B200/GB200、用于游戏的RTX 50系列。2025年将看到“Blackwell Ultra”,自然是升级版本,但具体情况没有说。2026年就是全新的下一代“Rubin”,命名源于美国女天文学家Vera Rubin(薇拉·鲁宾),搭配下一代HBM4高带宽内存,8堆栈。根据曝料,Rubin架构首款产品为R100,采用台积电3nm EUV制造工艺,四重曝光技术,CoWoS-L封装,预计2025年第四季度投产。2027年则是升级版的“Rubin Ultra”,HBM4内存升级为12堆栈,容量更大,性能更高。CPU方面下代架构代号“Vera”没错,用一个名字同时覆盖GPU、CPU,真正二合一。Vera CPU、Rubin GPU组成新一代超级芯片也在规划之中,将采用第六代NVLink互连总线,带宽高达3.6TB/s。此外,NVIDIA还有新一代数据中心网卡CX9 SuperNIC,最高带宽可达1600Gbps,也就是160万兆,并搭配新的InfiniBand/以太网交换机X1600。 ... PC版: 手机版:

封面图片

GeForce RTX 5090 GPU将采用大面积单片式GB202"Blackwell"芯片

GeForce RTX 5090 GPU将采用大面积单片式GB202"Blackwell"芯片 现在,根据内部人士 Kopite7kimi 发布的一条新推文,GPU 将采用单片式设计。虽然英伟达已经为其 HPC/AI 芯片(如 B100 和 B200)转向了芯片组设计,但该公司似乎仍希望为其面向消费者的 GPU 芯片保留单片封装。据说,GB202"Blackwell"GPU 将采用物理单片设计,而且从早先的报道中,我们知道它的 SM 和内核数量预计将是 GB203 的两倍,而 GB203 则是用于 GeForce RTX 5080 等产品的更为精简的芯片。这将使两款显卡的性能相差悬殊,但 RTX 5090 将是一款不折不扣的猛兽。让我们先来谈谈 GB202"黑井"图形处理器本身,目前可以确认的是它会是单片设计,英伟达可能会将两个 GB203 芯片封装在一个单片封装上,而不会使其看起来像Chiplet结构。这样可以更好地实现芯片间的通信,而不会出现芯片外通信瓶颈。虽然NVIDIA拥有克服瓶颈的解决方案,如 NVLINK 和其他互连技术,但它们可能会有点昂贵,因为它们会增加 GPU 的复杂性。英伟达已经有了一种解决方案,这种解决方案已经以 GA100 和 GH100 的形式在市场上推出,GA100 和 GH100 本质上是一个较小芯片的两半,通过互连连接,并通过一个分离的二级缓存进行通信。英伟达的Bryan Catanzaro解释说,这种实现方式提高了可扩展性,他们最初向这种设计的过渡非常顺利。预计该芯片还将采用台积电 4NP 工艺节点(5 纳米),密度将提高 30%(晶体管),因此除了架构升级外,也会带来不错的改进。现在,NVIDIA 可能也会在游戏方面采取同样的做法,这意味着如果整个项目取得成功,那么我们就能在未来看到 B100/B200 型芯片组产品。现在回到 NVIDIA GeForce RTX 5090,有多份报告称,我们可能会在这款下一代旗舰显卡上采用512 bit接口,而且已经有消息称,新一代怪兽级别显卡将采用全新的冷却和 PCB 解决方案。考虑到有传言称AMD 将凭借其 RDNA 4 阵容退出超高端图形性能领域,看起来英伟达一旦推出 Blackwell GPU,可能会进一步推动其在游戏领域的领先地位。GeForce RTX 5090 预计将在 RTX 5080 上市几周后推出,而 RTX 5080据传将是首款上架的 Blackwell 游戏 GPU。 ... PC版: 手机版:

封面图片

NVIDIA将在"Blackwell"GPU ASIC上采用 GDDR7 内存

NVIDIA将在"Blackwell"GPU ASIC上采用 GDDR7 内存 在"Blackwell"一代中,某些 GPU ASIC 类型将坚持使用较旧的内存标准,如 GDDR6 甚至 GDDR6X。这些将是当前 AD106 和 AD107 ASIC 的后继产品,为 RTX 4060 Ti 及以下的 SKU 提供基础。英伟达与美光科技(Micron Technology)共同开发了 GDDR6X 标准,后者是英伟达芯片的独家供应商。GDDR6X 可扩展至 23 Gbps 和 16 Gbit,这意味着英伟达可以利用 GDDR6X 为其低端产品堆栈提供充足的性能;特别是考虑到其 GDDR7 实现只能以 28 Gbps 运行,尽管市场上有 32 Gbps 甚至 36 Gbps 的芯片。即使英伟达为其入门级主流芯片选择了普通的 GDDR6 标准,该技术也可扩展到 20 Gbps。 ... PC版: 手机版:

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人