黄仁勋:CPU性能扩展速度下降 处理密集型应用应得到加速

黄仁勋:CPU性能扩展速度下降 处理密集型应用应得到加速 在黄仁勋看来,如果我们需要处理的数据继续呈指数级增长,但处理的性能却没有提升,我们将经历计算膨胀和计算成本的提升。他指出,有一种更好的方法增强计算机的处理性能,那便是通过计算机增强CPU提供加速工作,通过专用处理器做得更好。“现在,随着CPU扩展速度放缓,最终基本停止,我们应该加快让每一个处理密集型应用程序都得到加速,每个数据中心也肯定会得到加速,加速计算是非常明智的,这是很普通的常识。”黄仁勋表示。他指出,计算机图形学是一门完全可以并行操作的学科。计算机图形学、图像处理、物理模拟、组合优化、图形处理、数据库处理,以及深度学习中非常著名的线性代数,许多类型的算法都非常适合通过并行处理来加速。因此,英伟达通过为CPU添加专用的辅助处理器,来实现了对于密集型应用程序的加速。“由于这两个处理器可以并行工作,它们都是自治的,具有更多独立的值,我们可以将100个单位的时间加速到1个单位的时间,速度快得令人难以置信。”黄仁勋表示。 ... PC版: 手机版:

相关推荐

封面图片

黄仁勋:CPU 性能扩展速度下降,处理密集型应用应得到加速

黄仁勋:CPU 性能扩展速度下降,处理密集型应用应得到加速 6 月 2 日晚间消息,NVIDIA 创始人兼 CEO 黄仁勋在台湾大学综合体育馆发表现场主题演讲,黄仁勋演讲中表示,计算机行业在中央处理器(CPU)上运行的引擎,其性能扩展速度已经大大降低。然而,我们必须做的计算量,仍然在以指数级的速度翻倍。在黄仁勋看来,如果我们需要处理的数据继续呈指数级增长,但处理的性能却没有提升,我们将经历计算膨胀和计算成本的提升。他指出,有一种更好的方法增强计算机的处理性能,那便是通过计算机增强 CPU 提供加速工作,通过专用处理器做得更好。“现在,随着 CPU 扩展速度放缓,最终基本停止,我们应该加快让每一个处理密集型应用程序都得到加速,每个数据中心也肯定会得到加速,加速计算是非常明智的,这是很普通的常识。” 黄仁勋表示。他指出,计算机图形学是一门完全可以并行操作的学科。计算机图形学、图像处理、物理模拟、组合优化、图形处理、数据库处理,以及深度学习中非常著名的线性代数,许多类型的算法都非常适合通过并行处理来加速。因此,英伟达通过为 CPU 添加专用的辅助处理器,来实现了对于密集型应用程序的加速。“由于这两个处理器可以并行工作,它们都是自治的,具有更多独立的值,我们可以将 100 个单位的时间加速到 1 个单位的时间,速度快得令人难以置信。” 黄仁勋表示。(新浪科技)

封面图片

黄仁勋COMPUTEX2024演讲1.6万字全程实录:我们正在经历计算通货膨胀

黄仁勋COMPUTEX2024演讲1.6万字全程实录:我们正在经历计算通货膨胀 这场演讲涵盖了从 AI 基础技术到未来机器人和生成式 AI 在各个行业的应用,全面展示了英伟达在推动计算技术变革方面的卓越成就。黄仁勋表示,英伟达位于计算机图形、模拟和 AI 的交汇处,这是英伟达的灵魂。今天展示给我们的一切都是模拟的,它是数学、科学、计算机科学、令人惊叹的计算机架构的结合。这些都不是动画,而是自制的,英伟达把它全部融入了 Omniverse 虚拟世界。加速计算与 AI黄仁勋表示,我们所看到的一切的基础是两项基本技术,加速计算和在 Omniverse 内部运行的AI,这两股计算的基本力量,将重新塑造计算机行业。计算机行业已有 60 年的历史。在很多方面,今天所做的一切都是在 1964 年黄仁勋出生后一年发明的。IBM System 360 引入了中央处理单元、通用计算、通过操作系统实现硬件和软件的分离、多任务处理、IO子系统、DMA以及今天使用的各种技术。架构兼容性、向后兼容性、系列兼容性,所有今天对计算机了解的东西,大部分在1964 年就已经描述出来了。当然,PC 革命使计算民主化,把它放在了每个人的手中和家中。2007 年,iPhone 引入了移动计算,把计算机放进了我们的口袋。从那时起,一切都在连接并随时运行通过移动云。这 60 年来,我们只见证了两三次,确实不多,其实就两三次,主要的技术变革,计算的两三次构造转变,而我们即将再次见证这一切的发生。有两件基本的事情正在发生。首先是处理器,即计算机行业运行的引擎,中央处理单元的性能提升显著放缓。然而,我们需要进行的计算量仍然在迅速增长,呈指数级增长。如果处理需求,数据需要处理的量继续指数级增长但性能没有,计算通货膨胀将会发生。事实上,现在就看到了这一点。全球数据中心使用的电力量正在大幅增长。计算成本也在增长。我们正在经历计算通货膨胀。当然,这种情况不能继续下去。数据量将继续以指数级增长,而 CPU 性能提升将永远不会恢复。我们有更好的方法。近二十年来,英伟达一直在研究加速计算。CUDA 增强了 CPU,卸载并加速了专用处理器可以更好完成的工作。事实上,性能非常出色,现在很明显,随着 CPU 性能提升放缓并最终显著停止,应该加速一切。黄仁勋预测,所有需要大量处理的应用程序都会被加速,当然每个数据中心在不久的将来都会被加速。现在加速计算是非常合理的。如果你看看一个应用程序,这里100t 代表 100 单位时间,它可能是100秒,也可能是 100 小时。在很多情况下,如你所知,现在正在研究运行 100 天的 AI 应用程序。1T 代码是指需要顺序处理的代码,其中单线程CPU是非常关键的。操作系统控制逻辑非常重要,需要一条指令接着一条指令地执行。然而,有很多算法,比如计算机图形处理,可以完全并行操作。计算机图形处理、图像处理、物理模拟、组合优化、图处理、数据库处理,当然还有深度学习中非常著名的线性代数,这些算法都非常适合通过并行处理来加速。因此,发明了一种架构,通过在 CPU 上添加 GPU 来实现。专用处理器可以将耗时很长的任务加速到极快的速度。因为这两个处理器可以并肩工作,它们都是自主的,独立的,可以将原本需要 100 个时间单位的任务加速到 1 个时间单位,速度的提升是难以置信的,效果非常显著,速度提升了 100 倍,但功耗只增加了大约三倍,成本只增加了约 50%。在 PC 行业一直这样做,英伟达在1000 美元 PC 上加一个 500 美元 GeForce GPU,性能会大幅提升。英伟达在数据中心也这样做,一个价值十亿美元的数据中心,加上 5 亿美元的GPU,突然间它就变成了一个 AI 工厂,这种情况正在全球各地发生。节省的成本非常惊人。每花一美元就能获得 60 倍的性能提升,速度提升了 100倍,而功耗只增加了三倍,成本只增加了 1.5倍。这种节省是难以置信的。节省的成本可以用美元来衡量。很明显,许多公司在云端处理数据上花费了数亿美元。如果这些过程被加速,不难想象可以节省数亿美元。这是因为在通用计算上已经经历了很长时间的通货膨胀。现在终于决定加速计算,有大量被捕获的损失可以现在回收,许多被保留的浪费可以从系统中释放出来。这将转化为金钱的节省和能源的节省,这也是为什么黄仁勋常说‘买得越多,省得越多’。黄仁勋还表示,加速计算确实带来了非凡的成果,但它并不容易。为什么它能省这么多钱,但这么长时间以来人们却没有这样做呢?原因是因为这非常难。没有一种软件可以通过C编译器运行,突然间应用程序就快了100倍。这甚至不合逻辑。如果可以做到这一点,他们早就改造 CPU了。事实上,必须重写软件,这是最难的部分。软件必须完全重写,以便能够重新表达在 CPU 上编写的算法,使其能够被加速、卸载并行运行。这种计算机科学的练习极其困难。黄仁勋表示,在过去 20 年里,英伟达让全世界变得更容易。当然,非常著名 cuDNN,即处理神经网络的深度学习库。英伟达有一个 AI 物理库,可以用于流体动力学和许多其他应用中,神经网络必须遵守物理定律。英伟达有一个叫 Arial Ran 新的伟大库,它是一个 CUDA 加速 5G 无线电,能够像定义世界网络互联网一样定义和加速电信网络。加速的能力使我们能够将所有的电信转变为与云计算平台相同类型的平台。cuLITHO 是一个计算光刻平台,能够处理芯片制造中最计算密集的部分制作掩膜。台积电正在使用 cuLITHO 进行生产,节省了大量的能源和金钱。台积电的目标是加速他们的堆栈,以便为进一步的算法和更深入、更窄的晶体管的计算做好准备。Parabricks 是英伟达基因测序库,它是世界上吞吐量最高的基因测序库。cuOpt是一个用于组合优化、路线规划优化的令人难以置信的库,用于解决旅行商问题,非常复杂。科学家们普遍认为需要量子计算机来解决这个问题。英伟达创造了一个在加速计算上运行的算法,运行速度极快,创下了23项世界纪录。cuQuantum是一个量子计算机的模拟系统。如果你想设计一个量子计算机,你需要一个模拟器。如果你想设计量子算法,你需要一个量子模拟器。如果量子计算机不存在,你如何设计这些量子计算机,创建这些量子算法呢?你使用今天世界上最快的计算机,当然就是NVIDIA CUDA。在上面,英伟达有一个模拟器,可以模拟量子计算机。它被全世界数十万研究人员使用,并集成到所有领先的量子计算框架中,广泛用于科学超级计算中心。cuDF是一个令人难以置信的数据处理库。数据处理消耗了今天云端支出的绝大部分,所有这些都应该被加速。cuDF加速了世界上使用的主要库,比如Spark,许多公司可能都在使用Spark,Pandas,一个新的叫做Polars的库,当然还有NetworkX,一个图处理数据库库。这些只是一些例子,还有很多其他的。黄仁勋表示,英伟达必须创建这些库,以便让生态系统能够利用加速计算。如果英伟达没有创建cuDNN,光有 CUDA 是不可能让全世界的深度学习科学家使用的,因为 CUDA、TensorFlow 和 PyTorch中使用的算法之间的距离太远了。这几乎像是在没有OpenGL 情况下做计算机图形处理,或者没有 SQL 的情况下进行数据处理。这些特定领域的库是英伟达的珍宝,总共有350个库。正是这些库使英伟达能够打开如此多的市场。上周,Google 宣布在云端加速 Pandas,这是世界上最流行的数据科学库。你们中的许多人可能已经在使用Pandas,它被全球 1000 万数据科学家使用,每月下载1.7 亿次。 PC版: 手机版:

封面图片

:从入门到精通,利用NVIDIA GPU进行数学和机器学习的加速计算,适用于希望扩展算法至GPU的研究人员和应用专家

:从入门到精通,利用NVIDIA GPU进行数学和机器学习的加速计算,适用于希望扩展算法至GPU的研究人员和应用专家 CUDA(统一计算设备架构)是 NVIDIA 开发的并行计算平台和编程模型。它允许软件开发人员利用 NVIDIA GPU(图形处理单元)巨大的并行处理能力来执行通用计算任务,而不仅仅是其传统的图形渲染角色。 GPU 设计有数千个更小、更高效的核心,经过优化可同时处理多个任务。这使得它们非常适合可分解为许多独立操作的任务,例如科学模拟、机器学习、视频处理等。与传统的仅使用 CPU 的代码相比,CUDA 可显著提高合适应用程序的速度。 GPU 可以并行处理大量数据,从而加速在 CPU 上需要更长时间的计算。对于某些类型的工作负载,GPU 比 CPU 更节能,可提供更高的每瓦性能。

封面图片

黄仁勋公布NVIDIA路线图:明年升级Blackwell芯片 后年推出新一代AI平台

黄仁勋公布NVIDIA路线图:明年升级Blackwell芯片 后年推出新一代AI平台 在演讲开头,黄仁勋称自己很想用中文进行本次演讲,但因为要说的内容太多,对他而言难度过高。黄仁勋表示,自己的演讲有两个重点,即加速计算和AI,这两个要素“将能够重启电脑产业”。随后,黄仁勋花了较大篇幅来强调英伟达运算平台CUDA的重要性。黄仁勋表示,作为使用神经网络来进行深度学习的平台,CUDA显著推动了计算机科学在近20年内的进展。现在,全球已有500万名CUDA开发者。黄仁勋指出,CUDA已经实现了“良性循环”,能够在运算基础不断增长的情况下,扩大生态系统,令成本不断下降:“这将促使更多的开发人员提出更多的想法,带来更多的需求实验,成为伟大事业的开端。”黄仁勋称CUDA平台已实现良性循环。来源:英伟达直播此外,黄仁勋还重点介绍了英伟达仿真平台Omniverse。据介绍,Omniverse已经帮助众多大厂实现了数字孪生。例如,通过运用Omniverse,工厂可以事先规划流水线,气象学家可以预测极端气候等等。谈到英伟达的核心产品芯片,黄仁勋再次重申“买越多、省越多”。黄仁勋表示,计算机行业在中央处理器(CPU)上运行的引擎,其性能扩展速度已经大大降低。然而,需要处理的数据“继续呈指数级增长”,如果保持原状,人们将不得不经历计算膨胀和计算成本的提升。而在这种情况下,有一种更好的方法增强计算机的处理性能,那就是通过计算机增强CPU来提供加速计算:“现在,CPU的扩展速度逐渐放缓,最终会基本走向停止。我们应该让每一个处理密集型应用程序都得到加速,每个数据中心也就会得到加速。加速计算是非常明智的,这是普通常识。”黄仁勋宣传CPU和GPU相结合的加速计算。来源:英伟达直播在台上,黄仁勋又一次展示了英伟达在今年3月GTC大会上推出的最新Blackwell芯片,以及由其组装而成的机箱,乃至规模庞大的数据中心示意图。黄仁勋自豪地表示:“只有英伟达能做到,只有我们能做到。”更重要的是,黄仁勋透露,随着Blackwell芯片开始生产,英伟达计划每年升级AI加速器和AI芯片,预计将于2025年推出Blackwell Ultra,在2026年推出名为“Rubin”的下一代AI平台,该平台将采用HBM4内存。此前,天风国际分析师郭明𫓹预测,英伟达的下一代AI芯片“Rubin”系列/R100将在2025年第四季度开始量产。黄仁勋“剧透”英伟达此后的芯片规划。来源:英伟达直播就在半个月前,在发布2025财年第一财季财报后的英伟达业绩会上,黄仁勋曾表示,Blackwell芯片已经在“满负荷生产”,预计年内为公司“带来大量收入”。黄仁勋还屡次强调“我们正在加速”,称将在AI芯片上实现“一年一上新”。本次演讲的最后,话题又回到了机器人身上。据介绍,比亚迪、西门子、泰瑞达和Alphabet 旗下公司Intrinsic等全球十多家机器人行业领先企业已经在研究、开发和生产中采用NVIDIA Isaac机器人平台。黄仁勋表示:“机器人时代已经到来。有朝一日,移动的物体都将实现自主运行。”在截至4月28日的2025财年第一财季,英伟达期内实现营收260.44亿美元,同比上涨262%;净利润148.81亿美元,同比上涨628%。同时,该公司对下一季度的业绩做出指引,预测2025财年第二财季的销售额将达到280亿美元,上下浮动2%,高于市场预期的266亿美元。发布第一财季财报后,英伟达股价一度迅速飙升,助公司股价突破1000美元。当地时间5月31日,英伟达(Nasdaq:NVDA)股价收于每股1095.95美元,跌0.82%,总市值2.70万亿美元。据Wind数据,在过去的2023年中,英伟达股价涨幅超230%,今年以来涨幅已达到121.39%。 ... PC版: 手机版:

封面图片

NASA 超级计算机已落后:拖累任务进度,亟需升级换代

NASA 超级计算机已落后:拖累任务进度,亟需升级换代 报告指出,NASA 的超级计算机仍然主要依赖于 CPU 中央处理器,例如其旗舰超级计算机之一,竟拥有 18000 个 CPU,但仅有 48 个 GPU 图形处理器。要知道,GPU 在并行处理任务(科学模拟和建模中非常常见)方面能提供远超 CPU 的计算能力。

封面图片

黄仁勋最新对谈:8年间GPU芯片性能提高1000倍 未来机器人将更像人类

黄仁勋最新对谈:8年间GPU芯片性能提高1000倍 未来机器人将更像人类 “马斯克可以预见未来,但我认为,黄仁勋正在思考改变整个世界模式的遗产。黄仁勋一手缔造了一场工业革命。”克莱默表示,他已经购买了英伟达的股票,并获得了大量资金回报。在Mad Money对外公布的共计 20 多分钟视频中,黄仁勋坦言,英伟达用“加速计算”技术重新发明了计算机。在过去的8年里,英伟达提高了每个GPU芯片性能,AI 算力性能提高了1000倍。黄仁勋指的是全新的Blackwell架构B200芯片,比8年前的Pascal架构下的GPU产品提高1000倍 AI 性能。“现在,你可以拥有一台搭载GPU显卡、速度快100倍、能效高20倍、成本低20倍的计算机,能够解决复杂问题以及 AI 模型技术。”黄仁勋表示。黄仁勋也在对谈开头也感谢了股东的支持。他表示,在股东支持支持下,英伟达能够完成工作,实现英伟达的希望和梦想,为行业和世界做出真正的贡献。谈及全球 AI 军备竞赛,黄仁勋表示,无论是中国,还是美国、瑞典,各国需要做的重要事情是创造自己的 AI 技术,要有主权 AI 意识。“因为数据属于人民。这是他们国家的资产,他们的国家资源。它可以与其他所有人结合并共享,但我们很乐意提供硬件来帮助每个人做到这一点。”黄仁勋坦言,通过 AI 技术进步,他希望每个国家都应该收获一个自主可控的 AI 技术体系。展望未来,黄仁勋强调,未来的机器人将看起来更像人类,原因在于它能创造更多的自动化工厂,以及推动人类自动编写计算机软件。随着AI持续演进,使用 AI 技术的公司将更具市场竞争力,创造更多就业机会,从而使经济规模更大。(作者|林志佳)以下是黄仁勋对谈整理,由 AI 机器进行翻译,钛媒体App进行编辑(有删减):Jim Cramer:这是英伟达创始人、总裁兼CEO 黄仁勋(Jensen Huang),我叫他达芬奇。在我们深入了解这里发生的事情之前,先看一看,我们的观众想要感谢你让他们能够在你的股票上退休,让他们的孩子完成学业,改变他们的生活。我觉得这样说很有礼貌。黄仁勋:谢谢你们。我想对所有的股东说声谢谢。在他们的支持下。我们能够完成我们的工作,实现我们的希望和梦想,为行业和世界做出真正的贡献。所以我想谢谢你。Jim Cramer:我很感谢你。因为我们必须以这种方式开始,因为这是Mad Money疯狂的钱。你在这里创造的东西是非凡的,股票市场正在回报,2万亿美元的市值。我问问,你觉得,英伟达做了什么才配得上这样的估值?也许它仍然很便宜。黄仁勋:我认为,可能从来没有一家科技公司,对世界上最重要的行业之一做出更大的技术贡献。在如此大的规模上,我们重新发明了计算机。从我出生的第二年到1964年,电脑一直是一样的。而我们用“加速计算”的想法重新发明了它。现在,你可以拥有一台速度快100倍、能效高20倍、成本低20倍的计算机,能够以无人想象的规模解决问题。比如,我们帮助解决了人工智能;我们在智能自动化方面取得了巨大的进步,智能是每一个行业的基础。这就是他们都在这里的原因。Jim Cramer:这是智能工厂吗?黄仁勋:这个在未来。你现在看到的就是这个。你们能看到这些服务器吗?是世界上最密集的计算机。这取代了过去的整个数据中心,并将它们缩小到这个小数据中心。这个机架可能比几乎所有的计算机都更强大。Jim Cramer:在世界“计算机”变局当中,它会有两年,还是几年的变革?这会很慢吗?黄仁勋:每隔几年就会出现一些更不可思议的东西。在过去的8年里,我们提高了每个芯片的性能。8年间,我们将其中一个芯片的性能提高了1000倍。Jim Cramer:这意味着它可以快速下载一部电影或者看书?或者说这么快是什么意思?黄仁勋:首先,它可能会读那些东西,可能会读关于电影的东西。如果你想问关于那些电影或书的问题,你可以说读这本书,现在让我和你谈谈这本书,你可以和它谈论现在买任何东西。Jim Cramer:它能让像苹果Vision Pro一样,成为一种商业产品吗?如果能够像汽车一样制造它,了解它的感觉,它所看到的,那将是一件很棒的事情。也许这就是核心公司的销售要素。黄仁勋:首先,我很喜欢Vision Pro,我得告诉你,它真的很棒。我真的很喜欢它,他们在这方面做得很好。跟踪世界、登记世界中的所有对象,你会认为是真的在场景里面。而非常棒的是,当我们将Vision Pro与这个世界连接时,我们称之为Omniverse,它在这些计算机上运行。从本质上讲,我们创造了这个与物理世界重叠的数字世界,而苹果称之为空间计算。你觉得你几乎就在那里。Jim Cramer:AI 能够解决医疗问题吗?帕金森氏症发展数十年,但没有人能够征服它,那现在有可能吗?黄仁勋:就像我们用 AI 技术去理解一本小说一样,我们可以用类似的技术去理解蛋白质的意义、生命的意义。现在,一旦我们能够理解生命的意义,并能够在计算机中操作和使用它,我们就可以使用计算机来模拟生命,这样我们就不必在潮湿的实验室中进行大量的筛选。我们可以在电脑上做很多筛选,电脑做得很快。我们可以探索更大的化学空间,探索目标蛋白质空间,更大,更快。因此,无论我们最终决定如何进行试验,都将有更高的可能性,利用 AI 技术真正通过试验发现更多的小分子技术。Jim Cramer:我很想鼓励人们观看你的演讲,特别是最后翱翔的未来以及华丽的演讲画面。但人们没有意识到,你其实是其他公司供应商,这就是什么我认为,人们不能理解英伟达是一家价值2万亿美元公司的原因之一,因为英伟达没有手机终端。黄仁勋:但也从来没有一家电脑公司像我们这样。我们创造了一种全新的计算方式,我们与每个人合作,每个人都将在这里工作。研究人员和科学家进入这个来自价值100万亿美元的 AI 行业,变革医疗保健、金融服务、制造业等。当我们完成所有这些计算机的构建后,我们将它们分解成多个部分,并将它们集成到微软、Azure、惠普、戴尔和IBM的产品当中,然后将其推向市场。而应用软件由Cadence和Synopsys等公司提供。实际上,与我们合作的公司真的很棒,我们将自己的技术整合到Autodesk、Adobe等企业产品当中,甚至集成到所有计算机制造商中,让世界与其(我们)连接在一起。这就是为什么,我们在每一个地方,每一个云,每一个数据中心都有英伟达。Jim Cramer:这是我们一直听到的,但亚马逊正在开发一个有竞争力的 AI 芯片产品装备。我从你那里听到的一切都是好的,似乎没有听到和顾客“打仗”。黄仁勋:我们做的是非常不同的事情。首先是我们的GPU架构,一方面可以做 AI,另一方面也可以做计算机图形、物理模拟、数据处理、SQL数据处理等等。而这需要消耗大量的能源(量),大量的成本。对于许多客户来说,我们为他们减少了95%成本,持续使用的能源减少了20倍,连Google的数据支持现在也被GPU加速了。我们昨天宣布了与一家大公司合作的技术突破,利用 GPU,他们能够将加快数据处理速度。而所有这些,都是你可以在英伟达上做到的事情。如果你是一名开发人员,你在NVIDIA上开发,你可以在AWS、Azure、惠普、戴尔上运行它。Jim Cramer:但现在需求很旺盛,很多人说没有足够多的英伟达产品。扎克伯格还发视频说缺少35万张GPU卡。黄仁勋:我们在 AI 计算爬坡的开始,人类正处于加速计算的开始阶段。Jim Cramer:它将持续几年才能够得到?我无法获得足够的科技力量的话,我该怎样才能和Jensen的公司合作?黄仁勋... PC版: 手机版:

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人