OpenAI 携手 Scale AI，为企业增强 GPT 模型微调功能

OpenAI 携手 Scale AI，为企业增强 GPT 模型微调功能 OpenAI 近日发布新闻稿，宣布和 Scale AI 展开深度合作，在企业环境中增强 GPT-3.5 Turbo 和 GPT-4 大语言模型。 OpenAI 表示通过双方的深度合作，可以帮助企业定制 OpenAI 的大语言模型，满足企业的个性化需求。 OpenAI 在博文中再次强调，通过微调 API 发送的所有数据均为客户财产，不会被 OpenAI 或任何其他实体用于训练其他模型。 Scale AI 在数据标签和 AI 解决方案方面有着独到优势，OpenAI 将其列为“首选合作伙伴”。来源：、、

在Telegram中查看

相关推荐

OpenAI 携手 Scale AI，为企业增强 GPT 模型微调功能

OpenAI 携手 Scale AI，为企业增强 GPT 模型微调功能 OpenAI 近日，宣布和 Scale AI 展开深度合作，在企业环境中增强 GPT-3.5 Turbo 和 GPT-4 大语言模型。OpenAI 表示通过双方的深度合作，可以帮助企业定制 OpenAI 的大语言模型，满足企业的个性化需求。 OpenAI 在博文中再次强调，通过微调 API 发送的所有数据均为客户财产，不会被 OpenAI 或任何其他实体用于训练其他模型。 Scale AI 在数据标签和 AI 解决方案方面有着独到优势，OpenAI 将其列为“首选合作伙伴”。来源，频道：@kejiqu 群组：@kejiquchat 投稿：@kejiqubot

OpenAI 将自定义数据功能引入 GPT-3.5 Turbo

OpenAI 将自定义数据功能引入 GPT-3.5 Turbo 从而在构建特定行为的同时更轻松地提高文本生成 AI 模型的可靠性。 OpenAI ，GPT-3.5 的微调版本在“某些细分任务”上可以匹配甚至超越该公司旗舰模型GPT-4的基本功能。通过微调，通过 OpenAI 的 API 使用 GPT-3.5 Turbo 的公司可以使模型更好地遵循指令，例如让它始终以给定的语言进行响应。此外，微调使 OpenAI 客户能够缩短文本提示，以加快 API 调用并降低成本。微调成本如下：训练：0.008 美元/1K Token 使用输入：0.012 美元/1K Token 使用输出：0.016 美元/1K Token OpenAI 表示，对 GPT-4 的微调支持（与 GPT-3.5 不同，除了文本之外还可以理解图像）将于今年秋季晚些时候推出。

微软宣布允许企业在自己的数据上使用Azure OpenAI服务。该功能将激发世界各地的企业客户使用Azure OpenAI服务。

微软宣布允许企业在自己的数据上使用Azure OpenAI服务。该功能将激发世界各地的企业客户使用Azure OpenAI服务。 Azure OpenAI服务可以直接在你的数据上运行，无需进行额外的训练或微调。这意味着你可以直接使用OpenAI的模型（如ChatGPT和GPT-4）来处理你的数据，而无需对模型进行任何修改或调整。

OpenAI大模型GPT-5要来了！“提升很大”

OpenAI大模型GPT-5要来了！“提升很大” “它的性能非常棒，提升很大。”一位看过GPT-5大模型演示的CEO表示。该CEO表示，OpenAI使用他的公司独有的用例和数据展示了GPT-5。他说，OpenAI还提到了该模型尚未发布的其他功能，包括调用OpenAI正在开发的AI代理来自主执行任务。企业客户向OpenAI付费使用增强版ChatGPT。随着OpenAI拓展业务，其CEO山姆·奥特曼(Sam Altman)打造自己不断壮大的AI帝国，面向企业客户的销售成为了OpenAI的主要收入来源。不过，OpenAI尚未设定GPT-5的发布日期，这意味着公司内部对于这款大模型的发布时间预期可能会发生变化。据知情人士透露，OpenAI仍在训练GPT-5。在训练完成后，OpenAI将在内部对GPT-5进行安全测试，并进一步进行“红队”测试。在“红队”测试过程中，OpenAI员工和一些通常经过精选的外部人员会以各种方式对该工具进行挑战，以便在其向公众发布之前发现问题。知情人士指出，目前还没有GPT-5完成安全测试的具体时间表，所以该模型的发布日期可能会因为这一过程而推迟。GPT-4退化一年前，OpenAI针对ChatGPT发布了最后一次重大更新，该聊天机器人目前使用的是GPT-4大模型。OpenAI称，GPT-4的响应比之前的GPT-3要快得多，准确得多。OpenAI在2023年晚些时候发布了更强大的GPT-4 Turbo模型，以解决一个被称为“懒惰”的问题，因为该模型有时会拒绝回答提示问题。像GPT-4这样的大语言模型是通过从网络上收集的大量数据进行训练的，以权威的语调回应用户提示，呈现出类似人类语言模式的特点。这种语调以及所提供信息的质量可能会受到训练数据的影响，具体取决于OpenAI在开发和维护工作中所使用的数据更新或其他变化。目前，社交媒体Reddit上的几个论坛一直在抱怨GPT-4的退化和ChatGPT的糟糕输出。知情人士透露，OpenAI内部人士希望GPT-5更加可靠，给公众和企业客户留下深刻印象。与此同时，OpenAI还卷入了版权诉讼中。从技术上讲，AI模型的许多最关键训练数据都归版权所有者所有。OpenAI和许多其他科技公司都反对更新联邦法规，以限制大模型如何获取和使用这些材料。目前，OpenAI正在应对《纽约时报》等数据版权所有者发起的诉讼。截至发稿，OpenAI发言人尚未就此置评。 ... PC版：手机版：

OpenAI 探索用 GPT-2 小模型监督 GPT-4 大模型，防止 AI 毁灭人类

OpenAI 探索用 GPT-2 小模型监督 GPT-4 大模型，防止 AI 毁灭人类 Ilya 领衔的 OpenAI 对齐团队，发表了用类似 GPT-2 监督 GPT-4 的方法，或可帮人类搞定自己更聪明的超级 AI！团队声称，已经发现了对超人类模型进行实证对齐的新研究方向。未来超级 AI 系统对齐的一个核心挑战人类需要监督比自己更聪明人工智能系统。来源，频道：@kejiqu 群组：@kejiquchat

Scale AI发布首个大语言模型排行榜对特定领域的AI模型性能进行排名

Scale AI发布首个大语言模型排行榜对特定领域的AI模型性能进行排名 SEAL 排行榜显示，OpenAI 的 GPT 系列 LLM 在其用于人工智能模型排名的四个初始领域中的三个领域排名第一，Anthropic PBC 广受欢迎的 Claude 3 Opus 在第四个领域排名第一。Google LLC 的 Gemini 模型也表现出色，在其中几个领域与 GPT 模型并列第一。Scale AI表示，它之所以创建SEAL排行榜，是因为现在有数以百计的LLM可供公司使用，而人工智能的表现却缺乏透明度。这些排行榜由 Scale AI 的安全、评估和对齐实验室（Safety, Evaluations, and Alignment Lab）开发，并声称通过拒绝透露其用于评估 LLM 的提示的性质来保持中立性和完整性。该公司指出，虽然也有其他对LLM进行排名的努力，如MLCommons的基准和斯坦福HAI的透明度指数，但其在人工智能训练数据方面的专业知识意味着它在克服人工智能研究人员所面临的一些挑战方面具有独特的优势。例如，Scale AI指出，MLCommon的基准是公开的，因此公司可以对其模型进行专门训练，以准确响应他们使用的提示。SEAL 开发了私有的评估数据集，以保持其排名的完整性，据说其测试是由经过验证的领域专家创建的。此外，所使用的提示和给出的排名都经过仔细评估，以确保其可信度，同时通过公布所使用评估方法的明确解释来确保透明度。Scale AI 表示，在 Scale Coding 领域，每个模型都要在随机选择的提示上与评估中的其他模型进行至少 50 次比较，以确保结果的准确性。编码评估试图评估每个模型生成计算机代码的能力，排行榜显示，OpenAI 的 GPT-4 Turbo Preview 和 GPT-4o 模型与Google的 Gemini 1.5 Pro（I/O 后）并列第一。之所以将它们并列第一，是因为 Scale AI 只声称其评估分数的置信度为 95%，而且前三名之间的差距很小。尽管如此，GPT-4 Turbo Preview 似乎略胜一筹，获得了 1155 分，GPT-4o 以 1144 分位居第二，Gemini 1.5 Pro（Post I/O）获得了 1112 分。在多语言领域，GPT-4o 和 Gemini 1.5 Pro（Post I/O）并列第一，得分分别为 1139 分和 1129 分，GPT-4 Turbo 和 Gemini Pro 1.5（Pre I/O）紧随其后，并列第三。GPT-4o 在"指令跟踪"领域也名列前茅，获得 88.57 分，GPT-4 Turbo Preview 以 87.64 分名列第二。结果表明，Google在这一领域仍需努力，因为 OpenAI 最接近的竞争对手是 Meta Platforms 公司的开源 Llama 3 70b Instruct（得分 85.55）和 Mistral 公司的 Mistral Large Latest LLM（得分 85.34）。最后，Scale AI 测试了 LLM 的数学能力。事实证明，Anthropic 的 Claude 3 Opus 以 95.19 的高分拔得头筹，无可争议地获得了第一名，超过了 95.10 的 GPT-4 Turbo Preview 和 94.85 的 GPT-4o。这些比较很有意思，但似乎还不能说明全部问题，因为有很多备受瞩目的龙8国际娱乐城似乎没有被纳入评估范围。例如，AI21实验室公司的Jurassic和Jamba以及Cohere公司的Aya和Command LLM在所有四项评估中都明显缺席，埃隆-马斯克（Elon Musk）的生成式人工智能初创公司xAI Corp.建立的Grok模型也是如此。好消息是，Scale AI 可能会解决LLM排行榜不完整的问题。该公司表示，它打算每年多次更新排行榜，以确保其与时俱进。它将在"可用时"添加新的前沿模型。此外，它还计划在排行榜上添加新的领域，力争成为最值得信赖的大模型第三方评估机构。 ... PC版：手机版：

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人

相关推荐

OpenAI 携手 Scale AI，为企业增强 GPT 模型微调功能

OpenAI 将自定义数据功能引入 GPT-3.5 Turbo

微软宣布允许企业在自己的数据上使用Azure OpenAI服务。该功能将激发世界各地的企业客户使用Azure OpenAI服务。

OpenAI大模型GPT-5要来了！“提升很大”

OpenAI 探索用 GPT-2 小模型监督 GPT-4 大模型，防止 AI 毁灭人类

Scale AI发布首个大语言模型排行榜 对特定领域的AI模型性能进行排名

Scale AI发布首个大语言模型排行榜对特定领域的AI模型性能进行排名