OpenAI正在开发新推理技术模型代号草莓

OpenAI正在开发新推理技术模型代号草莓根据路透社 5 月份看到的一份 OpenAI 内部文件副本，OpenAI 内部团队正在开发 Strawberry。路透社无法确定该文件的具体发布日期，该文件详细说明了 OpenAI 打算如何使用 Strawberry 进行研究的计划。消息人士向路透社描述了该计划，称其为一项正在进行的工作。无法确定 Strawberry 距离公开发布还有多久。这位知情人士表示，即使在 OpenAI 内部，Strawberry 的工作原理也是一个严格保密的秘密。消息人士称，该文件描述了一个使用 Strawberry 模型的项目，目的是使公司的人工智能不仅能够生成查询的答案，而且能够提前规划，自主可靠的浏览互联网，从而执行 OpenAI 所称的深度研究。根据对十多位人工智能研究人员的采访，这是迄今为止人工智能模型尚未解决的问题。当被问及 Strawberry 和本文报道的细节时，OpenAI 公司发言人在一份声明中表示：我们希望我们的人工智能模型能够像我们一样看待和理解世界。持续研究新的人工智能能力是业内的常见做法，大家共同相信这些系统的推理能力会随着时间的推移而提高。该发言人没有直接回答有关草莓的问题。Strawberry 项目前身是 Q*，路透社去年报道称，该项目在公司内部已被视为一项突破。两位消息人士称，今年早些时候，他们观看了 OpenAI 工作人员告诉他们 Q* 演示，该演示能够回答当今商用模型无法解决的棘手科学和数学问题。据彭博社报道，周二，OpenAI 在一次内部全体会议上展示了一项研究项目的演示，该项目声称拥有新的类似人类的推理技能，OpenAI 发言人证实了此次会面，但拒绝透露会议内容细节。路透社无法确定所展示的项目是否是 Strawberry。知情人士表示，OpenAI 希望这项创新能够大幅提高其 AI 模型的推理能力，并补充说，Strawberry 涉及一种在非常大的数据集上进行预训练后处理 AI 模型的专门方法。接受路透社采访的研究人员表示，推理是人工智能实现人类或超人类水平智能的关键。虽然大型语言模型已经能够总结密集的文本，并以比人类快得多的速度撰写优美的散文，但该技术往往无法解决常识性问题，而这些问题的解决方案对人类来说似乎是直观的，例如识别逻辑谬误和玩井字游戏。当模型遇到这类问题时，它经常会产生幻觉，产生虚假信息。路透社采访的人工智能研究人员普遍认为，在人工智能的背景下，推理涉及形成一个模型，使人工智能能够提前规划，反映物理世界的运作方式，并可靠地解决具有挑战性的多步骤问题。提高人工智能模型的推理能力被视为释放模型能力的关键，包括实现重大科学发现、规划和构建新的软件应用程序等。OpenAI 首席执行官 Sam Altman今年早些时候表示，在人工智能领域最重要的进步领域将是推理能力。其他公司，如Google、Meta 和微软，也在尝试不同的技术来提高人工智能模型的推理能力，大多数进行人工智能研究的学术实验室也是如此。然而，研究人员对大型语言模型 (LLM) 是否能够将想法和长期规划融入预测方式的看法不一。例如，现代人工智能的先驱之一、在 Meta 工作的 Yann LeCun 经常说 LLM 不具备像人类一样的推理能力。人工智能挑战知情人士称，Strawberry 是 OpenAI 克服这些挑战计划的关键组成部分。路透社看到的文件描述了 Strawberry 想要实现的目标，但没有说明如何实现。据四位听过该公司宣传的人士透露，近几个月来，该公司一直在私下向开发者和其他外部人士发出信号，称其即将发布具有更先进推理能力的技术。他们拒绝透露姓名，因为他们无权谈论私人事务。一位消息人士称，Strawberry 采用了一种特殊的方式，即对 OpenAI 的生成式 AI 模型进行后训练，或者在对大量通用数据进行训练后，对基础模型进行调整，以特定方式磨练其性能。开发模型的后训练阶段涉及“微调”等方法，这是当今几乎所有语言模型都采用的一种方法，它有多种形式，例如让人类根据模型的响应向模型提供反馈，并为其提供好答案和坏答案的例子。一位知情人士称，Strawberry 与斯坦福大学 2022 年开发的一种名为自学推理机或STaR的方法有相似之处。STaR 的创建者之一、斯坦福大学教授诺亚·古德曼 (Noah Goodman) 告诉路透社，STaR 使人工智能模型能够通过迭代创建自己的训练数据将自己“引导”到更高的智能水平，理论上可以用来让语言模型超越人类水平的智能。古德曼说：我认为这既令人兴奋又令人恐惧……如果事情继续朝这个方向发展，我们人类就需要认真思考一些问题了。古德曼与 OpenAI 没有任何关系，对 Strawberry 也不熟悉。该文件称，OpenAI 为 Strawberry 瞄准的功能之一是执行长期任务 (LHT)，指的是需要模型提前规划并在较长时间内执行一系列操作的复杂任务，第一位消息人士解释说。根据 OpenAI 内部文件，OpenAI 正在利用公司所谓的深度研究数据集创建、训练和评估模型。路透社无法确定该数据集中包含哪些内容，也无法确定延长的时间段意味着什么。根据该文件和其中一位消息人士的说法，OpenAI 特别希望其模型能够利用这些功能进行研究，在CUA（即计算机使用代理）的帮助下自主浏览网页，并根据其发现采取行动。OpenAI 还计划测试其在软件和机器学习工程师工作方面的能力。 ... PC版：手机版：

在Telegram中查看

相关推荐

OpenAI 和 Meta 准备推出具有“推理”能力的新人工智能模型

OpenAI 和 Meta 准备推出具有“推理”能力的新人工智能模型 OpenAI 和 Meta 即将发布新的人工智能模型，他们表示这些模型将具备推理和规划的能力，这是在机器中实现超人认知的关键步骤。本周，OpenAI 和 Meta 的高管表示，他们正准备推出其大型语言模型的下一个版本。Meta 表示将在未来几周内开始推出 Llama 3，而微软支持的 OpenAI 表示，其下一个模型 GPT-5 将“很快”推出。Meta 人工智能研究副总裁乔尔•皮诺表示：“我们正在努力研究如何让这些模型不仅能说话，还能真正推理、规划……拥有记忆”。OpenAI 首席运营官布拉德•莱特卡普在接受记者采访时表示，下一代 GPT 将在解决推理等“难题”方面取得进展。他说：“我们将开始看到人工智能能够以更复杂的方式完成更复杂的任务。”“我认为，我们才刚刚开始触及这些模型推理能力的表面。” （）

大模型有望迎新突破 OpenAI、Meta将推出拥有“推理”功能的AI

大模型有望迎新突破 OpenAI、Meta将推出拥有“推理”功能的AI 本周，OpenAI和Meta的高管表示，两家公司正准备推出其大型语言模型的下一个版本，这些模型为生成式人工智能应用提供动力。Meta表示，将在未来几周内开始推出Llama 3；而OpenAI则表示，它的下一个型号，预计将被称为GPT-5，将“很快推出”。推理功能Meta人工智能研究副总裁Joelle Pineau表示，“我们正在努力弄清楚如何让这些模型不仅能说话，而且能真正进行推理和规划……拥有记忆。”OpenAI首席运营官Brad Lightcap在接受采访时表示，下一代GPT将在解决推理等“难题”方面取得进展，“我们将开始看到人工智能能够以更精密的方式处理更复杂的任务，我认为，我们才刚刚开始触及这些模型推理能力的表层。”Lightcap补充道，如今的人工智能系统“非常擅长一次性的小任务”，但其能力仍然“相当有限”。为AGI铺路伴随着科技公司间越来越“卷”技术，进步的步伐正在加快，它们竞相创造更复杂的生成式人工智能这种模型可以创造出与人类无异的文字、图像、代码和视频，其质量也在不断提高。今年，Google、Anthropic和Cohere等公司陆续发布了一波新的大语言模型。推理和规划功能便是通往“通用人工智能（AGI）”的必经之路。AGI拥有人类水平的认知，它允许聊天机器人和虚拟助手完成相关任务的序列，并预测其行为的后果。Meta首席人工智能科学家Yann LeCun周二（4月9日）在伦敦的一次活动上表示，目前的人工智能系统“在没有思考和计划的情况下，是一个接一个地生成单词”，他们很难处理复杂的问题或长时间记住信息，因此他们仍然会“犯愚蠢的错误”。他表示，增加推理能力意味着人工智能模型将“搜索可能的答案”、“计划行动的顺序”，并建立一个“关于其行动将产生何种影响的心理模型”。LeCun补充道，这正是目前模型的重要缺失部分，而这些能力将使机器达到下一个智能水平。OpenAI的Lightcap则表示，OpenAI很快就会对下一个版本的GPT“有更多话要说”。Lightcap称，“我认为随着时间的推移，我们将看到这些模型走向更长、更复杂的任务，这就要求他们提高推理能力。” ... PC版：手机版：

OpenAI 正在探索制造自己的人工智能芯片

OpenAI 正在探索制造自己的人工智能芯片据路透社报道，随着训练人工智能模型的芯片短缺情况日益恶化，公司内部关于人工智能芯片战略的讨论至少从去年开始就一直在进行。据报道，OpenAI 正在考虑采取多种策略来推进其芯片雄心，包括收购一家 AI 芯片制造商或加大内部设计芯片的力度。据路透社报道，OpenAI 首席执行官 Sam Altman 已将收购更多人工智能芯片作为公司的首要任务。目前，OpenAI 与大多数竞争对手一样，依靠基于 GPU 的硬件来开发ChatGPT、GPT-4和DALL-E 3等模型。GPU 并行执行多项计算的能力使其非常适合训练当今最强大的人工智能。但生成式人工智能的蓬勃发展对于 Nvidia 等 GPU 制造商来说是一笔意外之财却给 GPU 供应链带来了巨大压力。微软正在与 AMD 合作开发一款名为 Athena 的内部 AI 芯片，据说 OpenAI 正在测试该芯片。OpenAI 在研发方面的大力投资处于有利地位。该公司已筹集超过 110 亿美元的风险投资，年收入接近 10 亿美元。

报道微软正在自行开发比OpenAI更小更便宜的人工智能模型

报道微软正在自行开发比OpenAI更小更便宜的人工智能模型这些 SLM 旨在提供与 OpenAI 的 GPT 等大型语言模型（LLM）类似的对话和生成能力，但对硬件的需求大大降低。与外部开发的替代产品相比，这将使微软的人工智能产品和服务具有更低的相关成本和碳足迹。GenAI 团队预计将并入微软的 Azure 云计算部门，将专注于创建更小的语言模型。为了支持 GenAI 团队，微软还从其研究小组调来了几位顶尖开发人员。微软公司副总裁米沙-比连科（Misha Bilenko）将领导该团队的工作。GenAI 团队的目标是创造出与 OpenAI 等公司提供的模型功能相匹配甚至更强的人工智能，同时针对较小的规模进行优化。迄今为止，微软已将 OpenAI 的多项人工智能功能纳入其产品中。例如，必应在Copilot中使用了GPT-4，必应图像创建器在图像生成中使用了Dall-E。最近几周，该公司还推出了Copilot Pro一项针对个人消费者的订阅服务，为他们提供更先进的人工智能功能。该报告是在 OpenAI 最近推出 GPT 商店之后发布的，用户可以在该商店创建、分享和销售基于 OpenAI 语言模型的定制人工智能模型。同样，微软也宣布了自己的计划，即为Copilot提供针对特定需求和主题定制的人工智能聊天机器人。然而，依赖外部开发的人工智能会产生一些费用，而且缺乏对技术本身的控制。微软致力于开发更小巧、更经济实惠的人工智能技术，这有可能为公司提供自己的解决方案开辟新的途径，减少对第三方供应商的依赖。据说美国司法部（DOJ）和联邦贸易委员会（FTC）希望调查 OpenAI 与微软的关系，以防您错过。上周，我们曾报道，这两个机构都急于调查这笔交易，特别是微软的参与及其对人工智能行业竞争的影响。 ... PC版：手机版：

OpenAI公布大模型新训练方法：阻止ChatGPT“一本正经地胡说八道”

OpenAI公布大模型新训练方法：阻止ChatGPT“一本正经地胡说八道” OpenAI公司的研究人员表示，即使是最先进的人工智能模型也会杜撰虚假信息，尤其是在拿不准的时候，它们往往倾向于编造事实。在要求多步骤推理的领域，人工智能胡编的后果尤为严重，因为一个单一的逻辑错误会导致整个解决方案“翻车”。 OpenAI准备采用新战略，防止人工智能胡编。比如在过去，一旦提供一个正确的最终答案，模型会获得某种鼓励，但是以后，在每一个单一的逻辑推理环节如果表现正确，就将获得鼓励反馈。这种模式也被称之为“过程监督”（以往的模式术语“结果监督”）。研究人员表示，“过程监督”模式有助于产生更加清晰合理的回答，它将会鼓励生成式人工智能能够像人类一样，在推理思考中做到“环环相扣”。 OpenAI公司“随机生成数学”研究专家卡尔·柯比（Karl Cobbe）表示，发现并且减少人工智能模型的逻辑错误，也就是“AI幻觉”，是构建“通用人工智能”的关键一步。另外，“过程监督”模式并非OpenAI公司发明，但是该公司正在加以推广普及。来源，来自：雷锋频道：@kejiqu 群组：@kejiquchat 投稿：@kejiqubot

OpenAI 表示已开始训练新的旗舰人工智能模型

OpenAI 表示已开始训练新的旗舰人工智能模型 OpenAI 周二表示，它已开始训练一种新的旗舰人工智能模型，该模型将取代驱动其流行在线聊天机器人 ChatGPT 的 GPT-4 技术。 OpenAI 在一篇博客文章中表示，希望新模型能够带来“更高水平的能力”，因为该公司致力于打造“通用人工智能”，即能够做任何人类大脑能做的事情的机器。新模型将成为人工智能产品的引擎，包括聊天机器人、类似于苹果 Siri 的数字助理、搜索引擎和图像生成器。，

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人