黄仁勋COMPUTEX2024演讲1.6万字全程实录:我们正在经历计算通货膨胀

黄仁勋COMPUTEX2024演讲1.6万字全程实录:我们正在经历计算通货膨胀 这场演讲涵盖了从 AI 基础技术到未来机器人和生成式 AI 在各个行业的应用,全面展示了英伟达在推动计算技术变革方面的卓越成就。黄仁勋表示,英伟达位于计算机图形、模拟和 AI 的交汇处,这是英伟达的灵魂。今天展示给我们的一切都是模拟的,它是数学、科学、计算机科学、令人惊叹的计算机架构的结合。这些都不是动画,而是自制的,英伟达把它全部融入了 Omniverse 虚拟世界。加速计算与 AI黄仁勋表示,我们所看到的一切的基础是两项基本技术,加速计算和在 Omniverse 内部运行的AI,这两股计算的基本力量,将重新塑造计算机行业。计算机行业已有 60 年的历史。在很多方面,今天所做的一切都是在 1964 年黄仁勋出生后一年发明的。IBM System 360 引入了中央处理单元、通用计算、通过操作系统实现硬件和软件的分离、多任务处理、IO子系统、DMA以及今天使用的各种技术。架构兼容性、向后兼容性、系列兼容性,所有今天对计算机了解的东西,大部分在1964 年就已经描述出来了。当然,PC 革命使计算民主化,把它放在了每个人的手中和家中。2007 年,iPhone 引入了移动计算,把计算机放进了我们的口袋。从那时起,一切都在连接并随时运行通过移动云。这 60 年来,我们只见证了两三次,确实不多,其实就两三次,主要的技术变革,计算的两三次构造转变,而我们即将再次见证这一切的发生。有两件基本的事情正在发生。首先是处理器,即计算机行业运行的引擎,中央处理单元的性能提升显著放缓。然而,我们需要进行的计算量仍然在迅速增长,呈指数级增长。如果处理需求,数据需要处理的量继续指数级增长但性能没有,计算通货膨胀将会发生。事实上,现在就看到了这一点。全球数据中心使用的电力量正在大幅增长。计算成本也在增长。我们正在经历计算通货膨胀。当然,这种情况不能继续下去。数据量将继续以指数级增长,而 CPU 性能提升将永远不会恢复。我们有更好的方法。近二十年来,英伟达一直在研究加速计算。CUDA 增强了 CPU,卸载并加速了专用处理器可以更好完成的工作。事实上,性能非常出色,现在很明显,随着 CPU 性能提升放缓并最终显著停止,应该加速一切。黄仁勋预测,所有需要大量处理的应用程序都会被加速,当然每个数据中心在不久的将来都会被加速。现在加速计算是非常合理的。如果你看看一个应用程序,这里100t 代表 100 单位时间,它可能是100秒,也可能是 100 小时。在很多情况下,如你所知,现在正在研究运行 100 天的 AI 应用程序。1T 代码是指需要顺序处理的代码,其中单线程CPU是非常关键的。操作系统控制逻辑非常重要,需要一条指令接着一条指令地执行。然而,有很多算法,比如计算机图形处理,可以完全并行操作。计算机图形处理、图像处理、物理模拟、组合优化、图处理、数据库处理,当然还有深度学习中非常著名的线性代数,这些算法都非常适合通过并行处理来加速。因此,发明了一种架构,通过在 CPU 上添加 GPU 来实现。专用处理器可以将耗时很长的任务加速到极快的速度。因为这两个处理器可以并肩工作,它们都是自主的,独立的,可以将原本需要 100 个时间单位的任务加速到 1 个时间单位,速度的提升是难以置信的,效果非常显著,速度提升了 100 倍,但功耗只增加了大约三倍,成本只增加了约 50%。在 PC 行业一直这样做,英伟达在1000 美元 PC 上加一个 500 美元 GeForce GPU,性能会大幅提升。英伟达在数据中心也这样做,一个价值十亿美元的数据中心,加上 5 亿美元的GPU,突然间它就变成了一个 AI 工厂,这种情况正在全球各地发生。节省的成本非常惊人。每花一美元就能获得 60 倍的性能提升,速度提升了 100倍,而功耗只增加了三倍,成本只增加了 1.5倍。这种节省是难以置信的。节省的成本可以用美元来衡量。很明显,许多公司在云端处理数据上花费了数亿美元。如果这些过程被加速,不难想象可以节省数亿美元。这是因为在通用计算上已经经历了很长时间的通货膨胀。现在终于决定加速计算,有大量被捕获的损失可以现在回收,许多被保留的浪费可以从系统中释放出来。这将转化为金钱的节省和能源的节省,这也是为什么黄仁勋常说‘买得越多,省得越多’。黄仁勋还表示,加速计算确实带来了非凡的成果,但它并不容易。为什么它能省这么多钱,但这么长时间以来人们却没有这样做呢?原因是因为这非常难。没有一种软件可以通过C编译器运行,突然间应用程序就快了100倍。这甚至不合逻辑。如果可以做到这一点,他们早就改造 CPU了。事实上,必须重写软件,这是最难的部分。软件必须完全重写,以便能够重新表达在 CPU 上编写的算法,使其能够被加速、卸载并行运行。这种计算机科学的练习极其困难。黄仁勋表示,在过去 20 年里,英伟达让全世界变得更容易。当然,非常著名 cuDNN,即处理神经网络的深度学习库。英伟达有一个 AI 物理库,可以用于流体动力学和许多其他应用中,神经网络必须遵守物理定律。英伟达有一个叫 Arial Ran 新的伟大库,它是一个 CUDA 加速 5G 无线电,能够像定义世界网络互联网一样定义和加速电信网络。加速的能力使我们能够将所有的电信转变为与云计算平台相同类型的平台。cuLITHO 是一个计算光刻平台,能够处理芯片制造中最计算密集的部分制作掩膜。台积电正在使用 cuLITHO 进行生产,节省了大量的能源和金钱。台积电的目标是加速他们的堆栈,以便为进一步的算法和更深入、更窄的晶体管的计算做好准备。Parabricks 是英伟达基因测序库,它是世界上吞吐量最高的基因测序库。cuOpt是一个用于组合优化、路线规划优化的令人难以置信的库,用于解决旅行商问题,非常复杂。科学家们普遍认为需要量子计算机来解决这个问题。英伟达创造了一个在加速计算上运行的算法,运行速度极快,创下了23项世界纪录。cuQuantum是一个量子计算机的模拟系统。如果你想设计一个量子计算机,你需要一个模拟器。如果你想设计量子算法,你需要一个量子模拟器。如果量子计算机不存在,你如何设计这些量子计算机,创建这些量子算法呢?你使用今天世界上最快的计算机,当然就是NVIDIA CUDA。在上面,英伟达有一个模拟器,可以模拟量子计算机。它被全世界数十万研究人员使用,并集成到所有领先的量子计算框架中,广泛用于科学超级计算中心。cuDF是一个令人难以置信的数据处理库。数据处理消耗了今天云端支出的绝大部分,所有这些都应该被加速。cuDF加速了世界上使用的主要库,比如Spark,许多公司可能都在使用Spark,Pandas,一个新的叫做Polars的库,当然还有NetworkX,一个图处理数据库库。这些只是一些例子,还有很多其他的。黄仁勋表示,英伟达必须创建这些库,以便让生态系统能够利用加速计算。如果英伟达没有创建cuDNN,光有 CUDA 是不可能让全世界的深度学习科学家使用的,因为 CUDA、TensorFlow 和 PyTorch中使用的算法之间的距离太远了。这几乎像是在没有OpenGL 情况下做计算机图形处理,或者没有 SQL 的情况下进行数据处理。这些特定领域的库是英伟达的珍宝,总共有350个库。正是这些库使英伟达能够打开如此多的市场。上周,Google 宣布在云端加速 Pandas,这是世界上最流行的数据科学库。你们中的许多人可能已经在使用Pandas,它被全球 1000 万数据科学家使用,每月下载1.7 亿次。 PC版: 手机版:

相关推荐

封面图片

黄仁勋:CPU性能扩展速度下降 处理密集型应用应得到加速

黄仁勋:CPU性能扩展速度下降 处理密集型应用应得到加速 在黄仁勋看来,如果我们需要处理的数据继续呈指数级增长,但处理的性能却没有提升,我们将经历计算膨胀和计算成本的提升。他指出,有一种更好的方法增强计算机的处理性能,那便是通过计算机增强CPU提供加速工作,通过专用处理器做得更好。“现在,随着CPU扩展速度放缓,最终基本停止,我们应该加快让每一个处理密集型应用程序都得到加速,每个数据中心也肯定会得到加速,加速计算是非常明智的,这是很普通的常识。”黄仁勋表示。他指出,计算机图形学是一门完全可以并行操作的学科。计算机图形学、图像处理、物理模拟、组合优化、图形处理、数据库处理,以及深度学习中非常著名的线性代数,许多类型的算法都非常适合通过并行处理来加速。因此,英伟达通过为CPU添加专用的辅助处理器,来实现了对于密集型应用程序的加速。“由于这两个处理器可以并行工作,它们都是自治的,具有更多独立的值,我们可以将100个单位的时间加速到1个单位的时间,速度快得令人难以置信。”黄仁勋表示。 ... PC版: 手机版:

封面图片

黄仁勋:CPU 性能扩展速度下降,处理密集型应用应得到加速

黄仁勋:CPU 性能扩展速度下降,处理密集型应用应得到加速 6 月 2 日晚间消息,NVIDIA 创始人兼 CEO 黄仁勋在台湾大学综合体育馆发表现场主题演讲,黄仁勋演讲中表示,计算机行业在中央处理器(CPU)上运行的引擎,其性能扩展速度已经大大降低。然而,我们必须做的计算量,仍然在以指数级的速度翻倍。在黄仁勋看来,如果我们需要处理的数据继续呈指数级增长,但处理的性能却没有提升,我们将经历计算膨胀和计算成本的提升。他指出,有一种更好的方法增强计算机的处理性能,那便是通过计算机增强 CPU 提供加速工作,通过专用处理器做得更好。“现在,随着 CPU 扩展速度放缓,最终基本停止,我们应该加快让每一个处理密集型应用程序都得到加速,每个数据中心也肯定会得到加速,加速计算是非常明智的,这是很普通的常识。” 黄仁勋表示。他指出,计算机图形学是一门完全可以并行操作的学科。计算机图形学、图像处理、物理模拟、组合优化、图形处理、数据库处理,以及深度学习中非常著名的线性代数,许多类型的算法都非常适合通过并行处理来加速。因此,英伟达通过为 CPU 添加专用的辅助处理器,来实现了对于密集型应用程序的加速。“由于这两个处理器可以并行工作,它们都是自治的,具有更多独立的值,我们可以将 100 个单位的时间加速到 1 个单位的时间,速度快得令人难以置信。” 黄仁勋表示。(新浪科技)

封面图片

NVIDIA与日本合作开发尖端的ABCI-Q量子超级计算机

NVIDIA与日本合作开发尖端的ABCI-Q量子超级计算机 这个新项目名为 ABCI-Q,将完全由英伟达公司的加速和量子计算平台提供算力,预示着该系统将实现高性能和高效率。这台日本超级计算机还将与富士通公司合作建造。英伟达公司在早些时候的一篇博客文章中表示,该公司计划将其英伟达 CUDA-Q 平台集成到该系统中。该平台是一种开源资源,允许用户利用量子经典应用。CUDA-Q将作为超级计算机的一个组成部分,可以轻松集成相关的CPU和GPU。此外,Team Green还计划安装2000个英伟达H100人工智能GPU,并采用最新的英伟达Quantum-2 InfiniBand互联技术。NVIDIA高性能计算与量子计算总监 Tim Costa对此表示,研究人员需要高性能仿真来解决量子计算中最棘手的问题。CUDA-Q 和 NVIDIA H100 可帮助 ABCI 等先驱取得关键进展,加快量子集成超级计算的发展。日本的 ABCI-Q 超级计算机是该国技术创新阶段的一部分,他们计划利用量子计算和人工智能等当代技术的优势,在主流消费行业中领跑。几个月前,英伟达公司首席执行官黄仁勋会见了日本首相岸田文雄,双方谈到了加强多领域合作,为日本的需求提供稳定的人工智能设备供应。ABCI-Q 的发布只是日本与英伟达之间建立广泛合作关系的第一步。 ... PC版: 手机版:

封面图片

黄仁勋:学计算机的时代过去了,下一个黄金赛道是生命科学

黄仁勋:学计算机的时代过去了,下一个黄金赛道是生命科学 2月12日,2024 年世界政府峰会期间,英伟达 CEO 黄仁勋被阿联酋人工智能部长问及“如果站在科技的前沿,人们到底应该学习什么”,他回答称,“学计算机的时代过去了,生命科学 才是未来。”

封面图片

日本产综研将与英伟达合作打造量子计算系统

日本产综研将与英伟达合作打造量子计算系统 日本经济产业省下属的研究所 日本产业技术综合研究所 (AIST) 据悉将与英伟达合作打造量子计算系统,计划明年起向企业和研究人员收费提供服务。量子计算能够实现高速、复杂的计算处理,这将提高药物发现研究和物流的效率。日本产业技术综合研究所正在建构名为 ABCI-Q 的量子人工智能混合云系统。英伟达已经向 ABCI-Q 提供图形处理器 (GPU),同时也将通过云端服务提供量子计算软件。研究人员可以通过云端系统输入问题,并从计算机获取答复。AIST 希望通过向民间机构开放系统的方式,能够进一步推动量子计算技术的发展。 、

封面图片

谷歌科学家发布:量子计算机取得重大突破

谷歌科学家发布:量子计算机取得重大突破 谷歌科学家最近在ArXiv平台上发布了一篇预印本论文,声称在量子计算机领域取得了重大突破。他们表示,通过对Sycamore处理器的升级,谷歌成功提升了量子位的数量,从之前的53个增加到了70个。 这次实验中,谷歌科学家们执行了一项名为随机电路采样的任务,这个任务在量子计算中用于评估计算机的性能和效率。通过运行随机电路并分析结果输出,科学家们测试了量子计算机在解决复杂问题方面的能力。 谷歌的研究结果显示,升级后的70个量子位的Sycamore处理器在执行随机电路采样任务上比业内最先进的超级计算机快了几十亿倍。例如,需要业内最先进超级计算机Frontier计算47.2年才能完成的任务,53个量子位的Sycamore处理器只需要6.18秒就能完成,而新版的70个量子位的Sycamore处理器速度更快。来源 ,, 来自:雷锋 频道:@kejiqu 群组:@kejiquchat 投稿:@kejiqubot

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人