中信建投：OpenAI “超级对齐” 取得进展，由弱到强泛化实现 AI 可控

中信建投：OpenAI“超级对齐”取得进展，由弱到强泛化实现AI可控中信建投研报指出，12月15日，OpenAI“超级对齐”团队发布了成立以来的首篇论文，开辟了对超级模型进行实证对齐的新研究方向。OpenAI认为，比人类聪明得多的人工智能（超级智能）可以在未来十年之内发展出来，然而如何正确的引导和控制超人的人工智能系统仍然没有得到很好的解决，解决AI的可控问题对于如何确保最先进的人工智能系统始终安全并造福人类至关重要。在最新的研究中，OpenAI实现了从弱模型监督强模型的任务，OpenAI使用GPT-2模型来激发GPT-4的大部分能力，使其达到接近GPT-3.5级别的性能。实现了“弱到强泛化”（Weak-to-stronggeneralization），即让小模型监督大模型，为“超级对齐”提供了切实可行的技术路线。预期OpenAI将在“超级对齐”研究中取得持续突破，我们看好安全可控下的大模型行业发展前景。

在Telegram中查看

相关推荐

OpenAI 证实即便是超人工智能也能被人类有效控制

OpenAI证实即便是超人工智能也能被人类有效控制OpenAI认为超越人类的人工智能将在10年内到来，而人类能否监督比自身更聪明的模型一直是个被广泛讨论的话题。OpenAI的超级对齐团队给出了一个初步实证答案——可以。今天的情况是强到弱泛化，即人类(强老师)指导GPT-4(弱学生)学习。为了研究弱到强泛化的未来，OpenAI研究了一个简单的类比:小模型能监督大模型吗？结果证明，GPT-2监督的GPT-4达到了由人类监督的GPT-3.5性能。超级对齐团队测试后发现，许多简单的方法可以大大改进弱到强的泛化能力，比如鼓励强模型更加自信，包括在必要时自信地反对弱监督者的观点。又比如先对齐一个稍微超人的模型，然后用它对齐一个更智能的模型，而不是直接对齐非常超人的模型。投稿：@TNSubmbot频道：@TestFlightCN

OpenAI 探索用 GPT-2 小模型监督 GPT-4 大模型，防止 AI 毁灭人类

OpenAI探索用GPT-2小模型监督GPT-4大模型，防止AI毁灭人类Ilya领衔的OpenAI对齐团队，发表了——用类似GPT-2监督GPT-4的方法，或可帮人类搞定自己更聪明的超级AI！团队声称，已经发现了对超人类模型进行实证对齐的新研究方向。未来超级AI系统对齐的一个核心挑战——人类需要监督比自己更聪明人工智能系统。来源，频道：@kejiqu群组：@kejiquchat

OpenAI首席科学家有个计划寻找方法控制超级人工智能

OpenAI首席科学家有个计划寻找方法控制超级人工智能OpenAI的研究人员利奥波德·阿森布伦纳（LeopoldAschenbrenner）指出：“通用人工智能（AGI）正在迅速接近，我们将看到具有巨大能力但也可能非常危险的超智能模型，而我们还没有找到控制它们的方法。”他参与了今年7月成立的“超级对齐”（Superalignment）研究团队。OpenAI表示，将把其可用算力的五分之一用于“超级对齐”项目，以探索如何确保超级人工智能的安全性和可控性。OpenAI最近发布了一篇研究论文，介绍了一项实验结果。该实验旨在测试一种方法，让一个较差的人工智能模型在不降低智能的情况下指导一个更聪明的人工智能模型。尽管所涉及的技术还没有超过人类的灵活性，但该实验是为了应对未来人类必须与比自己更聪明的人工智能系统合作的时代而设计的。在实验中，OpenAI的研究人员检查了一种被称为监督的过程，它被用来调整像GPT-4这样的系统，使其更有帮助、更少伤害。GPT是ChatGPT背后的大语言模型。目前，这涉及到人类向人工智能系统反馈哪些答案是好的，哪些是坏的。随着人工智能的进步，研究人员正在探索如何将这一过程自动化以节省时间。此外，这也是因为他们认为，随着人工智能变得越来越强大，人类可能无法提供有用的反馈。在对照实验中，研究人员使用OpenAI于2019年首次发布的GPT-2文本生成器来教授GPT-4，并测试了两种解决方法。其中一种方法是逐步训练更大的模型，以减少每一步的性能损失；另一种方法是对GPT-4进行了算法调整，允许较强的模型遵循较弱模型的指导，而不会削弱其性能。第二种方法被证明更有效，尽管研究人员承认这些方法并不能保证更强的模型会完美运行，但可以将其作为进一步研究的起点。人工智能安全中心主任丹·亨德里克斯（DanHendryks）表示：“很高兴看到OpenAI主动解决控制超级人工智能的问题，我们需要多年的努力来应对这一挑战。”人工智能安全中心是旧金山一家致力于管理人工智能风险的非营利组织。阿森布伦纳与“超级对齐”团队的其他两名成员科林·伯恩斯（CollinBurns）和帕维尔·伊兹梅洛夫（PavelIzmailov）在接受采访时均表示，他们为迈出重要的第一步感到鼓舞，认为这有助于驯服潜在的超级人工智能。伊兹梅洛夫打了个比方：“就像一个六年级的学生，尽管他们比大学数学专业的学生所掌握的数学知识要少，但他们仍然能够向大学生传达他们想要达到的目标，而这正是我们所追求的效果。”“超级对齐”团队由OpenAI的首席科学家和联合创始人伊利亚·苏茨凯弗（IlyaSutskever）共同领导。苏茨凯弗也是上个月投票解雇首席执行官萨姆·奥特曼（SamAltman）的原董事会成员之一。不过后来他撤回了这一决定，并威胁说如果不让奥特曼复职，他就辞职。苏茨凯弗是这篇最新论文的合著者，但OpenAI拒绝让他讨论这个项目。上个月，奥特曼与OpenAI达成了协议，董事会的大部分成员都已经辞职，苏茨凯弗在OpenAI的未来也充满了不确定性。尽管如此，阿森布伦纳表示：“我们非常感谢苏茨凯弗，他是这个项目的推动者。”在人工智能领域，OpenAI的研究人员并不是第一个尝试使用现有技术来测试有助于驯服未来人工智能系统的团队。然而，与之前的企业和学术实验室的研究一样，我们无法确定在精心设计的实验中有效的想法在未来是否实用。研究人员将让一个较弱的人工智能模型训练一个更强的人工智能模型，他们称这种能力为“解决更广泛的‘超级对齐’问题的关键组成部分”。这种人工智能对齐实验也引发了一个关键问题：控制系统的可信度有多高？OpenAI新技术的核心在于，更强大的人工智能系统能够自己决定可以忽略较弱系统的哪些指导，这种选择可能会使其忽略可能阻止其未来以不安全方式行事的重要信息。为了使这样的系统有效，需要在提供一致性方面取得进展。伯恩斯强调：“你最终需要高度的信任。”加州大学伯克利分校研究人工智能安全的教授斯图尔特·拉塞尔（StuartRussell）表示，使用不那么强大的人工智能模型来控制更强大人工智能模型的想法已经存在了一段时间。但他也指出，到目前为止，我们还不清楚用于教授人工智能行为的方法是否可行，因为它们尚未能使当前的模型可靠地运行。尽管OpenAI正在迈出控制更先进人工智能的第一步，但该公司也渴望获得外界的帮助。OpenAI宣布将与谷歌前首席执行官埃里克·施密特（EricSchmidt）合作，向外部研究人员提供1000万美元的资助，以鼓励他们在从弱到强的监管、高级模型的可解释性以及针对旨在打破限制的提示下加强模型等领域取得进展。参与撰写这篇新论文的研究人员表示，OpenAI明年还将举行一次关于“超级对齐”的会议。作为OpenAI的联合创始人，也是“超级对齐”团队的联合负责人，他领导了该公司许多最重要的技术工作。同时，他也是越来越担心如何控制人工智能的知名专家之一，因为人工智能变得越来越强大。今年以来，如何控制未来人工智能技术的问题获得了新的关注，这在很大程度上归功于ChatGPT的影响。苏茨凯弗曾在深度神经网络先驱杰弗里·辛顿（GeoffreyHinton）的指导下攻读博士学位。后者于今年5月离开谷歌，以警告人们人工智能在某些任务中似乎正在接近人类的水平。（小小）...PC版：https://www.cnbeta.com.tw/articles/soft/1404653.htm手机版：https://m.cnbeta.com.tw/view/1404653.htm

中信建投：OpenAI 发布 GPT-4o，AGI 向前一步

中信建投：OpenAI发布GPT-4o，AGI向前一步中信建投研报表示，OpenAI举行春季发布会，重点发布GPT-4o大模型，性能达到GPT-4Turbo水平，能够实现多模态实时交互。同时，GPT-4o、ChatGPT会员版等多项功能未来将对所有用户免费开放，并推出桌面及手机双端应用，有望凭借易用性持续提升用户量。我们认为，OpenAI模型再次升级，重点发力多模态领域，且免费使用有望推动AI产业加速发展。

曝 OpenAI 超级对齐团队解散

曝OpenAI超级对齐团队解散OpenAI超级对齐团队正在分崩离析。团队负责人OpenAI联合创始人、首席科学家伊尔亚・苏茨克维（IlyaSutskever）与杨・莱克（JanLeike），本周双双离职。北京时间周五晚间，杨・莱克在社交平台X上公开解释了他为什么离职。他写到原因跟对核心优先事项以及团队分配资源的分歧有关，他更关注安全性、一致性等问题；超级对齐团队过去几个月一直在“逆风航行”，在计算上很吃力，完成研究越来越困难；过去几年，安全文化和流程已经让位于更耀眼的产品。这似乎是OpenAI高管第一次公开表示OpenAI将产品置于安全之上。

OpenAI确认正在开发GPT5，可能拥有超级智能

OpenAI确认正在开发GPT5，可能拥有超级智能OpenAI已开始构建下一代人工智能模型ChatGPT5，该公司的首席执行官SamAltman在最近的一次采访中证实了这一消息，并声称这个模型有可能拥有超级智能，但是要实现这个目标，还需要其长期合作伙伴微软的进一步投资。Altman还表示，从技术上讲，很难准确预测该模型可能具有哪些新功能和技能。投稿：@ZaiHuaBot频道：@TestFlightCN

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人