OpenAI 携手 Scale AI,为企业增强 GPT 模型微调功能

OpenAI 携手 Scale AI,为企业增强 GPT 模型微调功能 OpenAI 近日发布新闻稿,宣布和 Scale AI 展开深度合作,在企业环境中增强 GPT-3.5 Turbo 和 GPT-4 大语言模型。 OpenAI 表示通过双方的深度合作,可以帮助企业定制 OpenAI 的大语言模型,满足企业的个性化需求。 OpenAI 在博文中再次强调,通过微调 API 发送的所有数据均为客户财产,不会被 OpenAI 或任何其他实体用于训练其他模型。 Scale AI 在数据标签和 AI 解决方案方面有着独到优势,OpenAI 将其列为“首选合作伙伴”。 来源:、、

相关推荐

封面图片

OpenAI 携手 Scale AI,为企业增强 GPT 模型微调功能

OpenAI 携手 Scale AI,为企业增强 GPT 模型微调功能 OpenAI 近日,宣布和 Scale AI 展开深度合作,在企业环境中增强 GPT-3.5 Turbo 和 GPT-4 大语言模型。OpenAI 表示通过双方的深度合作,可以帮助企业定制 OpenAI 的大语言模型,满足企业的个性化需求。 OpenAI 在博文中再次强调,通过微调 API 发送的所有数据均为客户财产,不会被 OpenAI 或任何其他实体用于训练其他模型。 Scale AI 在数据标签和 AI 解决方案方面有着独到优势,OpenAI 将其列为“首选合作伙伴”。来源 , 频道:@kejiqu 群组:@kejiquchat 投稿:@kejiqubot

封面图片

OpenAI 将自定义数据功能引入 GPT-3.5 Turbo

OpenAI 将自定义数据功能引入 GPT-3.5 Turbo 从而在构建特定行为的同时更轻松地提高文本生成 AI 模型的可靠性。 OpenAI ,GPT-3.5 的微调版本在“某些细分任务”上可以匹配甚至超越该公司旗舰模型GPT-4的基本功能。 通过微调,通过 OpenAI 的 API 使用 GPT-3.5 Turbo 的公司可以使模型更好地遵循指令,例如让它始终以给定的语言进行响应。此外,微调使 OpenAI 客户能够缩短文本提示,以加快 API 调用并降低成本。 微调成本如下: 训练:0.008 美元/1K Token 使用输入:0.012 美元/1K Token 使用输出:0.016 美元/1K Token OpenAI 表示,对 GPT-4 的微调支持(与 GPT-3.5 不同,除了文本之外还可以理解图像)将于今年秋季晚些时候推出。

封面图片

OpenAI大模型GPT-5要来了!“提升很大”

OpenAI大模型GPT-5要来了!“提升很大” “它的性能非常棒,提升很大。”一位看过GPT-5大模型演示的CEO表示。该CEO表示,OpenAI使用他的公司独有的用例和数据展示了GPT-5。他说,OpenAI还提到了该模型尚未发布的其他功能,包括调用OpenAI正在开发的AI代理来自主执行任务。企业客户向OpenAI付费使用增强版ChatGPT。随着OpenAI拓展业务,其CEO山姆·奥特曼(Sam Altman)打造自己不断壮大的AI帝国,面向企业客户的销售成为了OpenAI的主要收入来源。不过,OpenAI尚未设定GPT-5的发布日期,这意味着公司内部对于这款大模型的发布时间预期可能会发生变化。据知情人士透露,OpenAI仍在训练GPT-5。在训练完成后,OpenAI将在内部对GPT-5进行安全测试,并进一步进行“红队”测试。在“红队”测试过程中,OpenAI员工和一些通常经过精选的外部人员会以各种方式对该工具进行挑战,以便在其向公众发布之前发现问题。知情人士指出,目前还没有GPT-5完成安全测试的具体时间表,所以该模型的发布日期可能会因为这一过程而推迟。GPT-4退化一年前,OpenAI针对ChatGPT发布了最后一次重大更新,该聊天机器人目前使用的是GPT-4大模型。OpenAI称,GPT-4的响应比之前的GPT-3要快得多,准确得多。OpenAI在2023年晚些时候发布了更强大的GPT-4 Turbo模型,以解决一个被称为“懒惰”的问题,因为该模型有时会拒绝回答提示问题。像GPT-4这样的大语言模型是通过从网络上收集的大量数据进行训练的,以权威的语调回应用户提示,呈现出类似人类语言模式的特点。这种语调以及所提供信息的质量可能会受到训练数据的影响,具体取决于OpenAI在开发和维护工作中所使用的数据更新或其他变化。目前,社交媒体Reddit上的几个论坛一直在抱怨GPT-4的退化和ChatGPT的糟糕输出。知情人士透露,OpenAI内部人士希望GPT-5更加可靠,给公众和企业客户留下深刻印象。与此同时,OpenAI还卷入了版权诉讼中。从技术上讲,AI模型的许多最关键训练数据都归版权所有者所有。OpenAI和许多其他科技公司都反对更新联邦法规,以限制大模型如何获取和使用这些材料。目前,OpenAI正在应对《纽约时报》等数据版权所有者发起的诉讼。截至发稿,OpenAI发言人尚未就此置评。 ... PC版: 手机版:

封面图片

OpenAI扩展其定制模型培训计划 帮助企业量身定制额外参数

OpenAI扩展其定制模型培训计划 帮助企业量身定制额外参数 但 OpenAI 表示,在与这批初始用户合作的过程中,它逐渐意识到需要"发展"该计划,以"进一步最大化性能",因此需要进行辅助微调。辅助微调是"定制模型"计划的一个新组成部分,它利用了微调以外的技术,如 OpenAI 所说的"更大规模的额外超参数和各种参数高效微调方法",使企业能够建立数据训练管道、评估系统等,以提高模型在特定任务中的性能。OpenAI 以韩国电信巨头 SK Telecom 为例,该公司与 OpenAI 合作对 GPT-4 进行了微调,以提高其在韩语"电信业务相关对话"中的性能。另一家协助微调的客户 Harvey 正在 OpenAI 初创基金的支持下构建人工智能驱动的法律工具,该公司与 OpenAI 合作创建了一个判例法定制模型,其中纳入了数亿字的法律文本和专家律师的反馈意见。"我们相信,未来绝大多数组织都将开发针对其行业、业务或用例的个性化定制模型,"OpenAI 在一篇博文中写道。"有了构建定制模型的各种技术,各种规模的组织都可以开发个性化模型,从而从其人工智能实施中实现更有意义、更具体的影响。"OpenAI 飞速发展,据说其年收入已接近惊人的 20 亿美元。但公司内部肯定也有压力,尤其是在公司计划与微软合作开发价值 1000 亿美元的数据中心之际(如果报道属实的话)。毕竟,训练和服务旗舰生成式人工智能模型的成本不会在短期内降低在 OpenAI 谋划下一步行动时,像定制模型训练这样的咨询工作可能正是保持收入稳定增长的关键。在扩大定制模型计划的同时,OpenAI 今天宣布为使用 GPT-3.5 的开发人员提供新的模型微调功能,包括用于比较模型质量和性能的新仪表板、支持与第三方平台的集成(从人工智能开发人员平台 Weights & Biases 开始)以及工具的增强。 ... PC版: 手机版:

封面图片

Scale AI发布首个大语言模型排行榜 对特定领域的AI模型性能进行排名

Scale AI发布首个大语言模型排行榜 对特定领域的AI模型性能进行排名 SEAL 排行榜显示,OpenAI 的 GPT 系列 LLM 在其用于人工智能模型排名的四个初始领域中的三个领域排名第一,Anthropic PBC 广受欢迎的 Claude 3 Opus 在第四个领域排名第一。Google LLC 的 Gemini 模型也表现出色,在其中几个领域与 GPT 模型并列第一。Scale AI表示,它之所以创建SEAL排行榜,是因为现在有数以百计的LLM可供公司使用,而人工智能的表现却缺乏透明度。这些排行榜由 Scale AI 的安全、评估和对齐实验室(Safety, Evaluations, and Alignment Lab)开发,并声称通过拒绝透露其用于评估 LLM 的提示的性质来保持中立性和完整性。该公司指出,虽然也有其他对LLM进行排名的努力,如MLCommons的基准和斯坦福HAI的透明度指数,但其在人工智能训练数据方面的专业知识意味着它在克服人工智能研究人员所面临的一些挑战方面具有独特的优势。例如,Scale AI指出,MLCommon的基准是公开的,因此公司可以对其模型进行专门训练,以准确响应他们使用的提示。SEAL 开发了私有的评估数据集,以保持其排名的完整性,据说其测试是由经过验证的领域专家创建的。此外,所使用的提示和给出的排名都经过仔细评估,以确保其可信度,同时通过公布所使用评估方法的明确解释来确保透明度。Scale AI 表示,在 Scale Coding 领域,每个模型都要在随机选择的提示上与评估中的其他模型进行至少 50 次比较,以确保结果的准确性。编码评估试图评估每个模型生成计算机代码的能力,排行榜显示,OpenAI 的 GPT-4 Turbo Preview 和 GPT-4o 模型与Google的 Gemini 1.5 Pro(I/O 后)并列第一。之所以将它们并列第一,是因为 Scale AI 只声称其评估分数的置信度为 95%,而且前三名之间的差距很小。尽管如此,GPT-4 Turbo Preview 似乎略胜一筹,获得了 1155 分,GPT-4o 以 1144 分位居第二,Gemini 1.5 Pro(Post I/O)获得了 1112 分。在多语言领域,GPT-4o 和 Gemini 1.5 Pro(Post I/O)并列第一,得分分别为 1139 分和 1129 分,GPT-4 Turbo 和 Gemini Pro 1.5(Pre I/O)紧随其后,并列第三。GPT-4o 在"指令跟踪"领域也名列前茅,获得 88.57 分,GPT-4 Turbo Preview 以 87.64 分名列第二。结果表明,Google在这一领域仍需努力,因为 OpenAI 最接近的竞争对手是 Meta Platforms 公司的开源 Llama 3 70b Instruct(得分 85.55)和 Mistral 公司的 Mistral Large Latest LLM(得分 85.34)。最后,Scale AI 测试了 LLM 的数学能力。事实证明,Anthropic 的 Claude 3 Opus 以 95.19 的高分拔得头筹,无可争议地获得了第一名,超过了 95.10 的 GPT-4 Turbo Preview 和 94.85 的 GPT-4o。这些比较很有意思,但似乎还不能说明全部问题,因为有很多备受瞩目的龙8国际娱乐城似乎没有被纳入评估范围。例如,AI21实验室公司的Jurassic和Jamba以及Cohere公司的Aya和Command LLM在所有四项评估中都明显缺席,埃隆-马斯克(Elon Musk)的生成式人工智能初创公司xAI Corp.建立的Grok模型也是如此。好消息是,Scale AI 可能会解决LLM排行榜不完整的问题。该公司表示,它打算每年多次更新排行榜,以确保其与时俱进。它将在"可用时"添加新的前沿模型。此外,它还计划在排行榜上添加新的领域,力争成为最值得信赖的大模型第三方评估机构。 ... PC版: 手机版:

封面图片

OpenAI 探索用 GPT-2 小模型监督 GPT-4 大模型,防止 AI 毁灭人类

OpenAI 探索用 GPT-2 小模型监督 GPT-4 大模型,防止 AI 毁灭人类 Ilya 领衔的 OpenAI 对齐团队,发表了 用类似 GPT-2 监督 GPT-4 的方法,或可帮人类搞定自己更聪明的超级 AI! 团队声称,已经发现了对超人类模型进行实证对齐的新研究方向。未来超级 AI 系统对齐的一个核心挑战 人类需要监督比自己更聪明人工智能系统。 来源, 频道:@kejiqu 群组:@kejiquchat

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人