OpenAI把微软电网搞崩 GPT-6被曝25年发布训练刷爆10万张H100

OpenAI把微软电网搞崩 GPT-6被曝25年发布训练刷爆10万张H100 就在刚刚，微软工程师爆料，10万个H100基建正在紧锣密鼓地建设中，目的就是训练GPT-6。微软工程师吐槽说，团队在部署跨区域GPU间的infiniband级别链接时遇到了困难。Corbitt：为何不考虑直接将所有设备部署在同一个地区呢？微软工程师：这确实是我们最初的方案。但问题是，一旦我们在同一个州部署超过100,000个H100 GPU，电网就会因无法负荷而崩溃。这是创业者Kyle Corbitt在社交媒体上，分享自己与一位微软工程师关于GPT-6训练集群项目的对话没想到，GPT-5还没发，微软就已悄悄为OpenAI开始训练GPT-6了。同在今天，一张“OpenAI内部时间线”图片在网上疯转。图中清晰标注出：OpenAI早在2022年8月-10月之间开始了GPT-5（代号Arrakis）的训练，2023年4月GPT-4.5（代号Gobi）在训练中。并且图中显示，GPT-6的测试，预计早在去年9月就开始了！同时，关于GPT-5（Arrakis）的一个爆料帖，也随之浮出水面。太长不看版贴中爆出许多内幕消息。比如，GPT-4.5因为能力不够，干脆被跳过，所以今年OpenAI会直接发GPT-5。另外还有若干未经证实的消息（从上图中也可以看出），关于OpenAI手中握着的一大把模型比如，Arrakis/GPT-5在GPT-4不久后训练了3个月，于22年10月结束；在GPT-5之后，GPT-4.5于23年4月完成训练。最劲爆的消息当然就是，现在GPT-6或许已经在训练中了。但是，GPT-5并不是AGI，因为无法解决“量子引力”问题。同理，GPT-6也不是AGI。接下来，让我们一一盘点下，帖子中都有哪些信息点。最接近AGI的模型，与人类专家不相上下去年8月，FeltSteam最先曝出OpenAI内部正在进行一个Arrakis多模态模型的项目，远超GPT-4，非常接近AGI。Arrakis项目被首次提及，是名叫FeltSteam的网友最先在Reddit一个评论区中爆料称，“Arrakis和Gobi都很酷”。并且，他在r/singularity板块中另一个问题下，介绍了Arrakis的一些能力。他提到，“这是一个无所不能的模型，可以输入文本、图像、音频和视频的任何组合”。具体来说，Arrakis更多的细节包括：- 多模态模型- 性能远超GPT-4- 接近AGI- 幻觉发生率明显低于GPT-4- Altman正试图将Arrakis作为一种工具来推销，尽管它是有感情的- 推理成本略低于GPT-4- 非常优秀的自主智能体- 训练一般数据是合成的与此同时，Jimmy Apples在社交媒体上曝出了OpenAI内部代号Gobi的项目大规模多模态模型。除了以上两个项目，一个代号名为“Sunshine”的项目逐渐浮出水面。OpenAI这些秘密进行的项目，一时间引来许多网友的猜测和讨论。随后，FeltSteam又爆出了更多的细节，Arrakis据称有125万亿参数，大约是GPT-4的100倍，并在2022年10月完成训练。值得一提的是，Arrakis不是通过计算资源实现的，而是通过提高计算效率实现的。目前，OpenAI内部也在使用Arrakis进行研究，不过整体员工水平肯定优于Arrakis。另外，与GPT-5相比，Gobi更接近GPT-4.5。到了10月，FeltSteam再一次表示，一个比GPT-4大100倍的模型即将问世。GPT-5将在2024年年中，或在2024年第三季度发布。最近BussinessInsider的报道称，知情人士透露，GPT-5或将在今年夏天发布。与FeltSteam预测的时间几乎吻合。而Arrakis是GPT-5一个更强大的候选者，在多个领域具备人类水平的专业知识能力。GPT-5不是AGI不过，Arrakis并不符合Altman对AGI的定义，即解决“量子引力”的问题。量子引力，又称量子重力，是描述对重力场进行量子化的理论，属于万有理论之一隅；主要尝试结合广义相对论与量子力学，为当前物理学尚未解决的问题但正如之前所说，Arrakis模型还是能够达到人类专家水平。GPT-5和GPT-6都不是AGIFeltSteam表示，传说中的AGI，是Arrakis以外的东西。但是，为什么我们能在这么短的时间里，训练出一个125万亿参数的模型呢？理论上来说，如果训一个1.75万亿参数模型需要4-5个月，那么如果训练一个大百倍的模型，应该需要几十年。（目前已知，GPT-4在A100集群上训了100天，但是在训练之后，OpenAI又花了几个月时间对它微调和对齐。）显然，要训125万亿参数的模型，不仅要投入原始计算资源，还要显著提高计算效率。用90%合成数据训练另一个比较值得关注的信息是，据称Arrakis去年训练的数据集中约90%是合成数据。此前，外媒报道称：Ilya Sutskever的突破让OpenAI克服了在获取高质量数据以训练新模型方面的限制，而这正是开发下一代模型的主要障碍。这项研究涉及使用计算机生成的数据，而不是真实世界的数据，如从互联网上提取的文本或图像来训练新模型。FeltSteam认为，OpenAI正遇到了扩展（scaling）的难题，因为仅仅扩展注意力和模型参数是远远不够的。目前，GPT-4的训练已经穷尽了整个互联网的数据，还需要进行强化学习，甚至更多的数据。另外，Arrakis还是一个非常出色的自主智能体。所有关于OpenAI项目信息汇总目录一览表。十万个H100训GPT-6，被电力卡脖子就在以上的爆料帖中，有一种说法是，GPT-6将于2025年发布。而就在爆料微软工程师对话的帖子中，也再次证实：微软正用10万个H100来帮OpenAI训练GPT-6！有网友算了一下，如果十万个H100同时开启，功耗将达到70兆瓦，电网肯定撑不住。而熟悉电力行业的网友说，一般大型电厂的输出功率将达到2000兆瓦，100兆瓦的负载其实并不大。但是突然在电网中增加100兆瓦的负载肯定会让电网系统出问题。核能也许是唯一的办法了，电力短缺将直接限制未来GPU的发展。此前，ChatGPT每天耗电已超50万千瓦时，登上了热搜，足见AI“吃电”非常凶猛。根据波士顿咨询集团的分析，到2030年，数据中心的用电量预计将增加两倍，相当于为大约4000万美国家庭供电所需的电力量没想到，马斯克预言的由AI导致的电力短缺，这么快就卡住AGI的脖子了。马斯克：“现在AI对算力的需求差不多每半年就会增加10倍，马上会超过宇宙的质量。芯片短缺缓解后，马上就会出现电力短缺。如果电网输出100-300千伏的电压，然后必须一路降压至6伏，未来会出现变压器短缺”。包括Sam Altman在内的越来越多的AI行业大佬表示，AI的第一性原理，最重要的部分就是能源和智能的转化率的问题。而人工智能是能源的无底洞，AI未来将会被能源卡脖子。因为Transformer本质上不是一个能效很高的算法，所以在未来，能源将会是困扰AI发展的一个大问题。对此，网友们表示，长期看好中国基建。而在Altman看来，满足AI飙升能源需求的最有效方法，就是核聚变。为此，他本人就在核聚变上投资了真金白银的数亿美元。没有突破，就没有办法到达那里，我们需要核聚变。然而，真要达成核聚变，却没那么快。英国曼彻斯特大学核聚变研究员Aneeqa Khan表示，“在地球上重建太阳中心的条件是一个巨大的挑战”，可能要到本世纪下半叶才能准备就绪。“核聚变已经为时已晚，无法应对气候危机。在短期内，我们可利用的是现有的低碳技术，比如裂变和可再生能源”。国际能源署（IEA）最近的一项分析计算出，数据中心、某货和人工智能的电力消耗在未来两年内可能会翻一番。2022年，它们约占全球电力需求的2%。同时AI的需求将呈指数级增长，在2023年至2026年间至少增长10倍此外，除了电力的限制之外，网友还继续脑洞大开，认为散热也将成为一个问题。10万块H100还会带来散热和空间堆叠的问题，其实最近3年这些问题一直都存在，未来还会越来越严重。网友进一步调侃到，未来加拿大会成为AI大国，因为他们有取之不尽的寒冷且干燥的空气！这些在AI时代将会是宝贵的自然资源。 ... PC版：手机版：

在Telegram中查看

相关推荐

GPT-5、开源、更强的ChatGPT！OpenAI公布2024年计划

GPT-5、开源、更强的ChatGPT！OpenAI公布2024年计划 OpenAI联合创始人兼首席执行官Sam Altman在社交平台公布，AGI（稍晚一些）、GPT-5、更好的语音模型、更高的费率限制；更好的GPTs；更好的推理能力；对唤醒/行为程度的控制；视频模型；个性化；更好地浏览；开源，将是OpenAI在2024年要实现的目标。来源：格隆汇

OpenAI大模型GPT-5要来了！“提升很大”

OpenAI大模型GPT-5要来了！“提升很大” “它的性能非常棒，提升很大。”一位看过GPT-5大模型演示的CEO表示。该CEO表示，OpenAI使用他的公司独有的用例和数据展示了GPT-5。他说，OpenAI还提到了该模型尚未发布的其他功能，包括调用OpenAI正在开发的AI代理来自主执行任务。企业客户向OpenAI付费使用增强版ChatGPT。随着OpenAI拓展业务，其CEO山姆·奥特曼(Sam Altman)打造自己不断壮大的AI帝国，面向企业客户的销售成为了OpenAI的主要收入来源。不过，OpenAI尚未设定GPT-5的发布日期，这意味着公司内部对于这款大模型的发布时间预期可能会发生变化。据知情人士透露，OpenAI仍在训练GPT-5。在训练完成后，OpenAI将在内部对GPT-5进行安全测试，并进一步进行“红队”测试。在“红队”测试过程中，OpenAI员工和一些通常经过精选的外部人员会以各种方式对该工具进行挑战，以便在其向公众发布之前发现问题。知情人士指出，目前还没有GPT-5完成安全测试的具体时间表，所以该模型的发布日期可能会因为这一过程而推迟。GPT-4退化一年前，OpenAI针对ChatGPT发布了最后一次重大更新，该聊天机器人目前使用的是GPT-4大模型。OpenAI称，GPT-4的响应比之前的GPT-3要快得多，准确得多。OpenAI在2023年晚些时候发布了更强大的GPT-4 Turbo模型，以解决一个被称为“懒惰”的问题，因为该模型有时会拒绝回答提示问题。像GPT-4这样的大语言模型是通过从网络上收集的大量数据进行训练的，以权威的语调回应用户提示，呈现出类似人类语言模式的特点。这种语调以及所提供信息的质量可能会受到训练数据的影响，具体取决于OpenAI在开发和维护工作中所使用的数据更新或其他变化。目前，社交媒体Reddit上的几个论坛一直在抱怨GPT-4的退化和ChatGPT的糟糕输出。知情人士透露，OpenAI内部人士希望GPT-5更加可靠，给公众和企业客户留下深刻印象。与此同时，OpenAI还卷入了版权诉讼中。从技术上讲，AI模型的许多最关键训练数据都归版权所有者所有。OpenAI和许多其他科技公司都反对更新联邦法规，以限制大模型如何获取和使用这些材料。目前，OpenAI正在应对《纽约时报》等数据版权所有者发起的诉讼。截至发稿，OpenAI发言人尚未就此置评。 ... PC版：手机版：

OpenAI 的 CEO 确认公司没有训练 GPT-5 并且“一段时间内不会”

OpenAI 的 CEO 确认公司没有训练 GPT-5 并且“一段时间内不会” 首席执行官 Sam Altman 驳斥了 OpenAI 已经在开发 GPT-5 的传言。在讨论 AI 系统带来的威胁时，OpenAI 的首席执行官兼联合创始人 Sam Altman 确认该公司目前没有训练 GPT-5，GPT-5 是今年 3 月发布的 AI 语言模型 GPT-4 的假定继承者。在麻省理工学院的一次活动中，Altman 被问及科技界最近流传的一封公开信，该公开信要求像 OpenAI 这样的实验室暂停开发“比 GPT-4 更强大”的人工智能系统。这封信强调了对未来系统安全性的担忧，但遭到了包括一些签署方在内的许多业内人士的批评。在麻省理工学院，Altman 表示这封信“缺少关于我们需要暂停的大部分技术细微差别”，并指出早期版本声称 OpenAI 目前正在训练 GPT-5。“一段时间内我们不会，”奥特曼说。“所以从这个意义上说，这有点愚蠢。” 然而，仅仅因为 OpenAI 没有在 GPT-5 上工作并不意味着它没有扩展 GPT-4 的功能。

GPT-5要来了？OpenAI已申请GPT5商标

GPT-5要来了？OpenAI已申请GPT5商标企查查APP显示，近日，欧爱运营有限责任公司（OPENAI OPCO, LLC）在中国申请注册2枚“GPT-5”商标，国际分类包括科学仪器、网站服务，当前商标状态均为申请中。此外，据媒体报道，美国专利商标局(USPTO)披露的一份文件显示：OpenAI于7月18日提交了「GPT-5」的商标申请。并且已经被接收。在这次披露的申请书中，OpenAI提到，尚未发布的GPT-5将具备众多GPT-4所没有的能力，而且几乎每一项都剑指AGI。标签: #OpenAI 频道: @GodlyNews1 投稿: @GodlyNewsBot

为什么OpenAI更有可能在今年发布GPT-4.5而不是GPT-5？

为什么OpenAI更有可能在今年发布GPT-4.5而不是GPT-5？据人工智能安全中心（Center for AI Safety）主任丹-亨德里克斯（Dan Hendrycks）称，OpenAI 的 GPT LLM 每迭代一次，所需的计算资源就增加 10 倍。因此，如果 OpenAI 跳过 GPT-4.5，直接跳到 GPT-5，那么计算需求将比 GPT-4 增加约 100 倍，相当于约 100 万个 H100 芯片连续运行三个月。Anthropic公司首席执行官达里奥-阿莫代（Dario Amodei）最近指出，目前培养一名最先进的 LLM 需要花费约 10 亿美元，预计到 2025/26 年，这一成本将激增到 50 亿到 100 亿美元之间。重要的是，10 亿美元的培训成本与 GPT-4.5 可以合理推断出的 10 倍计算资源激增相吻合。我们最近注意到，英伟达今年部署的 H100 设备预计年耗电量约为13000 GWh，相当于立陶宛和危地马拉等国的年耗电量。到 2027 年，全球数据中心的耗电量预计将达到85 到 134 太瓦时（TWh）！我们之前提到过，GPT-4 的竞争对手正在迅速迎头赶上。Meta公司的Llama 3 LLM（700亿参数）目前在Arena排行榜上排名前五。重要的是，Llama 3 现在已经超越了所有其他开源 LLM，这还是在没有即将推出的 4050 亿参数模型的情况下。此外，一些专家现在认为，GPT-5 必须改变"原始课程"，其中包括利用"不完善的人类对话"和整体"幼稚"的训练过程。这与我们最初的观点不谋而合，即 OpenAI 很可能会在今年发布一个迭代的 GPT-4.5 模型，而不是在 GPT-5 中彻底改变赌注。 ... PC版：手机版：

让GPT-4帮人类训练GPT-4！OpenAI推出新模型CriticGPT

让GPT-4帮人类训练GPT-4！OpenAI推出新模型CriticGPT 美东时间6月27日周四，OpenAI公布，其研究人员训练了一个基于 GPT-4 的模型，它被称为 CriticGPT，用于捕捉ChatGPT 代码输出中的错误。简单来说就是，CriticGPT让人能用 GPT-4 查找 GPT-4 的错误。它可以写出使用者对ChatGPT响应结果的批评评论，从而帮助人类训练者在RLHF期间发现错误。OpenAI发现，如果通过CriticGPT获得帮助审查 ChatGPT编写的代码，人类训练师的审查效果比没有获得帮助的人强60%。OpenAI称，正着手将类似 CriticGPT 的模型集成到旗下 RLHF 标记管道中，为自己的训练师提供明确的AI帮助。OpenAI称，因为没有更好的工具，所以人们目前难以评估高级的AI系统的表现。而CriticGPT意味着，OpenAI向能够评估高级AI系统输出的目标迈进了一步。，OpenAI举了一个例子，如下图所示，对ChatGPT提出一个用 Python 编写指定函数的任务，对于ChatGPT根据要求提供的代码，CriticGPT点评了其中一条指令，提议换成效果更好的。OpenAI称，CriticGPT 的建议并不是全都正确无误，但OpenAI的人员发现，相比没有这种AI的帮助，有了它，训练师可以发现更多模型编写答案的问题。此外，当人们使用CriticGPT 时，这种AI模型会增强他们的技能，从而得出的批评结论比单单人类训练师做的更全面，并且比AI模型单独工作时产生的幻觉错误更少。在OpenAI的实验中，在60%以上的时间里，随机选择的训练师都更喜欢来自人类与CriticGPT 合作的批评结论，而不是来自没有CriticGPT协助的人类训练师批评。OpenAI同时提到了目前开发CriticGPT的四点局限。其中之一是，OpenAI用 ChatGPT 的简短答案训练CriticGPT，因此未来需要发掘能帮助训练师理解冗长且复杂任务的方法。第二点是，模型仍然会产生幻觉，有时训练师在看到这些幻觉后会犯下标记错误。第三点是，有时现实世界中的错误可能分散在答案的许多部分之中，OpenAI目前的工作重点是让模型指出一处的错误，未来还需要解决分散在不同位置的错误。第四点，OpenAI指出，CriticGPT 只能提供有限的帮助：如果ChatGPT面对的任务或响应极其复杂，即使是有模型帮助的专家也可能无法正确评估。最后，OpenAI表示，为了协调日益复杂的 AI 系统，人们需要更好的工具。在对 CriticGPT 的研究中，OpenAI发现，将 RLHF 应用于 GPT-4 有望帮助人类为 GPT-4 生成更好的 RLHF 数据。OpenAI计划，进一步扩大这项工作，并将其付诸实践。OpenAI在原名Twitter的社交媒体X上公布了新模型CriticGPT后，一条点赞超1万的网友评论称，自我改进已经开始了。另一条点赞上万的热截取了OpenAI的相关研究文章结论，其中提到，在智能方面，大语言模型（LLM）和LLM的批评都只会继续改进，而人类的智能不会，这条评论感叹，真是悲观。还有网友引用了漫威超级英雄电影《复仇者联盟》中灭霸的一句台词，点评OpenAI所说的用GPT-4找GPT-4的错误：“我用宝石摧毁了宝石。” ... PC版：手机版：

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人