NVIDIA下下代GPU有名字了！证实暗物质的女天文学家

NVIDIA下下代GPU有名字了！证实暗物质的女天文学家 NVIDIA的下一代GPU架构代号Blackwell，来自美国统计学家布莱克威尔，预计2024年底或2025年开始登场。根据最新靠谱曝料，NVIDIA下下代GPU架构的代号已经基本敲定，那就是“Vera Rubin”。

在Telegram中查看

相关推荐

NVIDIA官宣全新Rubin GPU、Vera CPU 3nm工艺配下代HBM4内存

NVIDIA官宣全新Rubin GPU、Vera CPU 3nm工艺配下代HBM4内存 NVIDIA现有的高性能GPU架构代号“Blackwell”，已经投产，相关产品今年陆续上市，包括用于HPC/AI领域的B200/GB200、用于游戏的RTX 50系列。2025年将看到“Blackwell Ultra”，自然是升级版本，但具体情况没有说。2026年就是全新的下一代“Rubin”，命名源于美国女天文学家Vera Rubin(薇拉·鲁宾)，搭配下一代HBM4高带宽内存，8堆栈。根据曝料，Rubin架构首款产品为R100，采用台积电3nm EUV制造工艺，四重曝光技术，CoWoS-L封装，预计2025年第四季度投产。2027年则是升级版的“Rubin Ultra”，HBM4内存升级为12堆栈，容量更大，性能更高。CPU方面下代架构代号“Vera”没错，用一个名字同时覆盖GPU、CPU，真正二合一。Vera CPU、Rubin GPU组成新一代超级芯片也在规划之中，将采用第六代NVLink互连总线，带宽高达3.6TB/s。此外，NVIDIA还有新一代数据中心网卡CX9 SuperNIC，最高带宽可达1600Gbps，也就是160万兆，并搭配新的InfiniBand/以太网交换机X1600。 ... PC版：手机版：

天文学家揭示暗物质在星系演化中的作用

天文学家揭示暗物质在星系演化中的作用星系图像，左侧为恒星部分，右侧（负片）为星系光环中的暗物质。资料来源：Gabriel Pérez Díaz, SMM (IAC) / EAGLE 团队传统上对星系演化的观测研究主要集中在普通物质的作用上，尽管普通物质只占星系质量的很小一部分。几十年来，人们一直在理论上预测暗物质对星系演化的影响。然而，尽管做了很多努力，人们对此并没有达成明确的共识。现在，由IAC团队领导的研究首次通过观测证实了暗物质对星系演化的影响。暗物质对星系的影响显而易见，因为我们可以测量它，但暗物质对星系演化的影响是有人提出过的，尽管我们没有观测研究它的技术。为了研究暗物质的影响，研究小组集中研究了星系中恒星的质量与从其旋转中可以推断出的质量（称为总动力质量）之间的差异。研究结果表明，恒星的年龄、金属含量、形态、角动量和形成速度不仅取决于这些恒星的质量，还取决于总质量，这就意味着要把暗物质成分包括在内，而暗物质成分符合对光环质量的估计。"我们看到，在恒星质量相等的星系中，恒星群的表现会因星系光环中暗物质的多寡而不同，换句话说，星系从形成到现在的演化过程会因星系所处的光环而改变。"文章合著者之一、IAC 研究员伊格纳西奥-马丁-纳瓦罗（Ignacio Martín Navarro）补充说："如果星系所处的光环质量较大或较小，那么星系随时间的演化就会不同，这将反映在星系所含恒星的性质上。"今后，研究小组计划对距离银河系中心不同距离的恒星群进行测量，并证明恒星的特性对暗物质晕的依赖是否在所有半径范围内都保持不变。研究的下一步将是研究暗物质晕与宇宙大尺度结构之间的关系。这些暗物质光环并不是单独产生的，它们由细丝连接起来，构成了大尺度结构的一部分，被称为'宇宙网'。光环的质量似乎改变了星系的属性，但这可能是每个光环在宇宙网中所处位置的结果。在未来几年里，希望能够看到这种大尺度结构在我们所研究的范围内产生的影响。这项研究是基于卡拉阿托遗留整体场区（CALIFA）的260个星系进行的，卡拉阿托遗留整体场区是一个国际项目，在文章的另一位合著者赫苏斯-法尔孔-巴罗佐（Jesús Falcón Barroso）的协调下，IAC积极参与了该项目。他说："这项调查提供了光谱信息和前所未有的星系空间覆盖范围。我们对这些星系进行了高分辨率观测，获得了它们运动特性的详细测量数据，这使我们能够非常精确地研究恒星的运动，从而推断出星系的总质量。"编译自:ScitechDaily ... PC版：手机版：

Intel Panther Lake下下代处理器升级下下代GPU架构性能飙升

Intel Panther Lake下下代处理器升级下下代GPU架构性能飙升其中，H系列的CPU配置为4个P大核、8个E小核、4个e超低功耗小核，也就是总计16核心16线程；U系列则没有了小核，只有4个大核、4个超低功耗小核，也就是8核心8线程。大核架构继续升级为Cougar Cove，小核架构则和Arrow Lake/Lunar Lake一样都是Skymont。据说，Panther Lake相比于Lunar Lake的能效会提升多达35％，而后者相比于Lunar Lake多核性能将提升50％。GPU方面，Lunar Lake会升级为第二代Battlemage Xee-LPG，Panther Lake则会继续升级到第三代Celetial Xe3-LPG，最多核心数量也从8个增加到12个，据说性能提升40％。泄露代码显示，Panther Lake GPU核显将有GT2、GT3两个级别，但具体区别不详。有趣的是，Panther Lake GPU AI算力也会大幅提升达到120 TOPS，再加上CPU、GPU整体可达170 TOPS，相比于Lunar Lake提升多达70％。Panther Lake预计至少要到2025年才会发布，应该会隶属于第三代酷睿Ultra。 ... PC版：手机版：

天文学家获得NASA资金支持将跟踪超大质量黑洞合并产生的电磁信号

天文学家获得NASA资金支持将跟踪超大质量黑洞合并产生的电磁信号 RIT 数学与统计学院特聘教授兼计算相对论与引力中心主任 Manuela Campanelli 将在数学与统计学院教授 Yosef Zlochower 的帮助下领导该合作项目。该项目还将包括来自爱达荷大学、约翰霍普金斯大学和戈达德太空飞行中心的研究人员。研究小组将把天体物理学知识与最先进的模拟相结合，研究双黑洞系统周围的气体流动。这些模拟的主要目标是准确预测与这些双黑洞相关的光信号，这对于识别和理解这些神秘的宇宙事件至关重要。这些发现将为星系的形成和演化提供有价值的见解，并为天文学的进步做出重大贡献。RIT 的科学家获得了美国国家航空航天局（NASA）的资助，通过创建有助于识别和理解宇宙事件的高级模拟来研究超大质量黑洞。这幅可视化作品是该团队早期工作的一部分。资料来源：Lorenzo Ennoggi 和 Jay Kalinani/RIT坎帕内利解释说："这个项目旨在推动我们对在合并星系核心相互螺旋撞击的超大质量黑洞的理解向前迈进一大步。我们团队的综合专业知识将为新发现铺平道路。"这项研究将对理解宇宙演化产生深远影响，并将在识别和定位超大质量黑洞双星方面发挥关键作用。先进的模拟和世界上最大的超级计算机将为研究提供支持。洛伦佐-恩诺吉（Lorenzo Ennoggi）是天体物理科学与技术专业的博士生，他也是 RIT 团队的一员。恩诺吉说："我们已经开发出所有必要的工具来进行这些极具挑战性的模拟，我们已经准备好开始调查。这是一个尚未开发的领域，因此无论我们发现什么，都将是全新的。"研究星系碰撞时黑洞是如何合并的，将有助于科学家进一步了解星系是如何形成和演化的。通过重点研究气体和物质在星系合并的不同阶段被吸入黑洞时的行为，研究小组的目标是创建迄今为止最准确、最真实的光信号预测。编译来源：ScitechDaily ... PC版：手机版：

NVIDIA“最强AI芯片”Blackwell B200 GPU令业内惊呼新的摩尔定律诞生

NVIDIA“最强AI芯片”Blackwell B200 GPU令业内惊呼新的摩尔定律诞生在GTC直播中，黄仁勋左手举着 B200 GPU，右手举着 H100此外，将两个B200 GPU与单个Grace CPU 结合在一起的 GB200，可以为LLM推理工作负载提供30倍的性能，并且显著提高效率。黄仁勋还强调称：“与H100相比，GB200的成本和能耗降低了25倍！关于市场近期颇为关注的能源消耗问题，B200 GPU也交出了最新的答卷。黄仁勋表示，此前训练一个1.8 万亿参数模型，需要8000 个 Hopper GPU 并消耗15 MW电力。但如今，2000 个 Blackwell GPU就可以实现这一目标，耗电量仅为4MW。在拥有1750亿参数的GPT-3大模型基准测试中，GB200的性能是H100的7倍，训练速度是H100的4倍。值得一提的是，B200 GPU的重要进步之一，是采用了第二代Transformer引擎。它通过对每个神经元使用4位（20 petaflops FP4）而不是8位，直接将计算能力、带宽和模型参数规模翻了一倍。而只有当这些大量的GPU连接在一起时，第二个重要区别才会显现，那就是新一代NVLink交换机可以让576个GPU相互通信，双向带宽高达1.8TB/秒。而这就需要英伟达构建一个全新的网络交换芯片，其中包括500亿个晶体管和一些自己的板载计算：拥有3.6 teraflops FP8处理能力。在此之前，仅16个GPU组成的集群，就会耗费60%的时间用于相互通信，只有40%的时间能用于实际计算。一石激起千层浪，“最强AI芯片”的推出让网友纷纷赞叹。其中英伟达高级科学家Jim Fan直呼：Blackwell新王诞生，新的摩尔定律已经应运而生。DGX Grace-Blackwell GB200：单个机架的计算能力超过1 Exaflop。黄仁勋交付给OpenAI的第一台DGX是0.17 Petaflops。GPT-4的1.8T参数可在2000个Blackwell上完成90天的训练。还有网友感叹：1000倍成就达成！Blackwell标志着在短短8年内，NVIDIA AI 芯片的计算能力实现了提升1000倍的历史性成就。2016 年，“Pascal”芯片的计算能力仅为19 teraflops，而今天Blackwell的计算能力已经达到了 20000 teraflops。相关文章:全程回顾黄仁勋GTC演讲：Blackwell架构B200芯片登场英伟达扩大与中国车企合作为比亚迪提供下一代车载芯片英伟达进军机器人领域发布世界首款人形机器人通用基础模型台积电、新思科技首次采用NVIDIA计算光刻平台：最快加速60倍NVIDIA共享虚拟现实环境技术将应用于苹果Vision Pro黄仁勋GTC演讲全文：最强AI芯片Blackwell问世推理能力提升30倍 ... PC版：手机版：

AMD Zen6架构继续飞跃核显跨越下下代RDNA5

AMD Zen6架构继续飞跃核显跨越下下代RDNA5 Zen6的服务器版代号为Morpehus(古希腊神话梦神摩耳甫斯)，消费级版代号则是“Medusa”(美杜莎)。最新说法称，Medusa Zen6会进入新的2.5D互连封装技术，取代现在传统式多die互连的chiplet小芯片，从而提升传输带宽与性能。Zen6架构的锐龙还会集成RDNA5架构的GPU核显，这也意味着，尚未露面的RDNA4会被跳过去。至于为何这么做，尚不清楚，可能是RDNA4提升不够大，也可能是RDNA5的进展更快。有趣的是，就在不久前，微软关于Xbox主机的一份文档中，就提到了Zen6、Navi5后者就是RDNA5家族。根据此前曝料，Zen6架构将会全面升级，制造工艺升级到CCD 2nm、IOD 3nm，CCD再次升级为原生32核心，IPC性能再提升10％，支持16通道内存，加入AI/ML FP16浮点指令等等。理论上，Zen6 EPYC可以做到庞大的256核心512线程！4 ... PC版：手机版：

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人