OpenAI 携手 Scale AI，为企业增强 GPT 模型微调功能

OpenAI携手ScaleAI，为企业增强GPT模型微调功能OpenAI近日，宣布和ScaleAI展开深度合作，在企业环境中增强GPT-3.5Turbo和GPT-4大语言模型。OpenAI表示通过双方的深度合作，可以帮助企业定制OpenAI的大语言模型，满足企业的个性化需求。OpenAI在博文中再次强调，通过微调API发送的所有数据均为客户财产，不会被OpenAI或任何其他实体用于训练其他模型。ScaleAI在数据标签和AI解决方案方面有着独到优势，OpenAI将其列为“首选合作伙伴”。来源，频道：@kejiqu群组：@kejiquchat投稿：@kejiqubot

在Telegram中查看

相关推荐

OpenAI 将自定义数据功能引入 GPT-3.5 Turbo

OpenAI将自定义数据功能引入GPT-3.5Turbo从而在构建特定行为的同时更轻松地提高文本生成AI模型的可靠性。OpenAI，GPT-3.5的微调版本在“某些细分任务”上可以匹配甚至超越该公司旗舰模型GPT-4的基本功能。通过微调，通过OpenAI的API使用GPT-3.5Turbo的公司可以使模型更好地遵循指令，例如让它始终以给定的语言进行响应。此外，微调使OpenAI客户能够缩短文本提示，以加快API调用并降低成本。微调成本如下：训练：0.008美元/1KToken使用输入：0.012美元/1KToken使用输出：0.016美元/1KTokenOpenAI表示，对GPT-4的微调支持（与GPT-3.5不同，除了文本之外还可以理解图像）将于今年秋季晚些时候推出。——

OpenAI扩展其定制模型培训计划帮助企业量身定制额外参数

OpenAI扩展其定制模型培训计划帮助企业量身定制额外参数但OpenAI表示，在与这批初始用户合作的过程中，它逐渐意识到需要"发展"该计划，以"进一步最大化性能"，因此需要进行辅助微调。辅助微调是"定制模型"计划的一个新组成部分，它利用了微调以外的技术，如OpenAI所说的"更大规模的额外超参数和各种参数高效微调方法"，使企业能够建立数据训练管道、评估系统等，以提高模型在特定任务中的性能。OpenAI以韩国电信巨头SKTelecom为例，该公司与OpenAI合作对GPT-4进行了微调，以提高其在韩语"电信业务相关对话"中的性能。另一家协助微调的客户Harvey正在OpenAI初创基金的支持下构建人工智能驱动的法律工具，该公司与OpenAI合作创建了一个判例法定制模型，其中纳入了数亿字的法律文本和专家律师的反馈意见。"我们相信，未来绝大多数组织都将开发针对其行业、业务或用例的个性化定制模型，"OpenAI在一篇博文中写道。"有了构建定制模型的各种技术，各种规模的组织都可以开发个性化模型，从而从其人工智能实施中实现更有意义、更具体的影响。"OpenAI飞速发展，据说其年收入已接近惊人的20亿美元。但公司内部肯定也有压力，尤其是在公司计划与微软合作开发价值1000亿美元的数据中心之际（如果报道属实的话）。毕竟，训练和服务旗舰生成式人工智能模型的成本不会在短期内降低--在OpenAI谋划下一步行动时，像定制模型训练这样的咨询工作可能正是保持收入稳定增长的关键。在扩大定制模型计划的同时，OpenAI今天宣布为使用GPT-3.5的开发人员提供新的模型微调功能，包括用于比较模型质量和性能的新仪表板、支持与第三方平台的集成（从人工智能开发人员平台Weights&Biases开始）以及工具的增强。...PC版：https://www.cnbeta.com.tw/articles/soft/1426219.htm手机版：https://m.cnbeta.com.tw/view/1426219.htm

Scale AI发布首个大语言模型排行榜对特定领域的AI模型性能进行排名

ScaleAI发布首个大语言模型排行榜对特定领域的AI模型性能进行排名SEAL排行榜显示，OpenAI的GPT系列LLM在其用于人工智能模型排名的四个初始领域中的三个领域排名第一，AnthropicPBC广受欢迎的Claude3Opus在第四个领域排名第一。GoogleLLC的Gemini模型也表现出色，在其中几个领域与GPT模型并列第一。ScaleAI表示，它之所以创建SEAL排行榜，是因为现在有数以百计的LLM可供公司使用，而人工智能的表现却缺乏透明度。这些排行榜由ScaleAI的安全、评估和对齐实验室（Safety,Evaluations,andAlignmentLab）开发，并声称通过拒绝透露其用于评估LLM的提示的性质来保持中立性和完整性。该公司指出，虽然也有其他对LLM进行排名的努力，如MLCommons的基准和斯坦福HAI的透明度指数，但其在人工智能训练数据方面的专业知识意味着它在克服人工智能研究人员所面临的一些挑战方面具有独特的优势。例如，ScaleAI指出，MLCommon的基准是公开的，因此公司可以对其模型进行专门训练，以准确响应他们使用的提示。SEAL开发了私有的评估数据集，以保持其排名的完整性，据说其测试是由经过验证的领域专家创建的。此外，所使用的提示和给出的排名都经过仔细评估，以确保其可信度，同时通过公布所使用评估方法的明确解释来确保透明度。ScaleAI表示，在ScaleCoding领域，每个模型都要在随机选择的提示上与评估中的其他模型进行至少50次比较，以确保结果的准确性。编码评估试图评估每个模型生成计算机代码的能力，排行榜显示，OpenAI的GPT-4TurboPreview和GPT-4o模型与Google的Gemini1.5Pro（I/O后）并列第一。之所以将它们并列第一，是因为ScaleAI只声称其评估分数的置信度为95%，而且前三名之间的差距很小。尽管如此，GPT-4TurboPreview似乎略胜一筹，获得了1155分，GPT-4o以1144分位居第二，Gemini1.5Pro（PostI/O）获得了1112分。在多语言领域，GPT-4o和Gemini1.5Pro（PostI/O）并列第一，得分分别为1139分和1129分，GPT-4Turbo和GeminiPro1.5（PreI/O）紧随其后，并列第三。GPT-4o在"指令跟踪"领域也名列前茅，获得88.57分，GPT-4TurboPreview以87.64分名列第二。结果表明，Google在这一领域仍需努力，因为OpenAI最接近的竞争对手是MetaPlatforms公司的开源Llama370bInstruct（得分85.55）和Mistral公司的MistralLargeLatestLLM（得分85.34）。最后，ScaleAI测试了LLM的数学能力。事实证明，Anthropic的Claude3Opus以95.19的高分拔得头筹，无可争议地获得了第一名，超过了95.10的GPT-4TurboPreview和94.85的GPT-4o。这些比较很有意思，但似乎还不能说明全部问题，因为有很多备受瞩目的龙8国际娱乐城似乎没有被纳入评估范围。例如，AI21实验室公司的Jurassic和Jamba以及Cohere公司的Aya和CommandLLM在所有四项评估中都明显缺席，埃隆-马斯克（ElonMusk）的生成式人工智能初创公司xAICorp.建立的Grok模型也是如此。好消息是，ScaleAI可能会解决LLM排行榜不完整的问题。该公司表示，它打算每年多次更新排行榜，以确保其与时俱进。它将在"可用时"添加新的前沿模型。此外，它还计划在排行榜上添加新的领域，力争成为最值得信赖的大模型第三方评估机构。...PC版：https://www.cnbeta.com.tw/articles/soft/1432840.htm手机版：https://m.cnbeta.com.tw/view/1432840.htm

谷歌发布AI语言模型PaLM 2 挑战OpenAI的GPT-4

谷歌发布AI语言模型PaLM2挑战OpenAI的GPT-4皮查伊称：“PaLM2在逻辑和推理方面进行了广泛的训练，具有极强的逻辑和推理能力。同时，它还接受了多语言文本训练，支持100多种语言。谷歌在2022年4月首次发布了PaLM语言模型。谷歌高级研究总监斯拉夫·彼得罗夫（SlavPetrov）称，最新的PaLM2在一系列基于文本的任务上表现更好，包括推理、编码和翻译等。他说：“与PaLM1相比，PaLM2有了显著提升。”对于PaLM2，谷歌工程师在一份研究论文中称，该系统的语言熟练程度“足以教授这门语言”。与其他大型语言模型一样，PaLM2与其说是一款单一产品，不如说是一系列产品。它拥有不同的版本，可部署在消费者和企业环境中。确切而言，PaLM2分为四种规格，从小到大依次为Gecko、Otter、Bison和Unicorn，依据特定领域的数据进行了微调，以执行企业客户的特定任务。其中，体积最小的Gecko可以在手机上运行，每秒可处理20个Token，大约相当于16或17个单词。谷歌还称，PaLM2已被用于支持自家的25项功能和产品，其中包括AI聊天机器人Bard，以及谷歌文档、幻灯片和工作表等。...PC版：https://www.cnbeta.com.tw/articles/soft/1359045.htm手机版：https://m.cnbeta.com.tw/view/1359045.htm

OpenAI发布最新旗舰生成式AI模型GPT-4o 改进文本、视觉和音频功能

OpenAI发布最新旗舰生成式AI模型GPT-4o改进文本、视觉和音频功能穆拉提在OpenAI办公室举行的主题演讲上说：GPT-4o的理由横跨语音、文本和视觉。OpenAI将发布桌面版ChatGPT和全新的用户界面。穆拉提说："我们知道这些模型越来越复杂，但我们希望交互体验变得更自然、更简单，让你完全不用关注用户界面，而只关注与GPT的协作。这一点非常重要，因为我们正在展望人类与机器之间互动的未来。"GPT-4是OpenAI之前的领先模型，它是图像和文本的结合体，可以分析图像和文本，完成从图像中提取文本甚至描述图像内容等任务。但GPT-4o增加了语音功能。这具体能带来什么？很多方面。GPT-4o极大地改善了ChatGPT的体验--ChatGPT是OpenAI的病毒式人工智能聊天机器人。ChatGPT长期以来一直提供语音模式，使用文本到语音模式转录ChatGPT中的文本。但GPT-4o对此进行了改进，让用户可以更像使用助手一样与ChatGPT互动。例如，用户可以向由GPT-4o支持的ChatGPT提问，并在ChatGPT回答时打断它。OpenAI表示，该模型能提供"实时"响应，甚至能捕捉用户声音中的情感，并生成"一系列不同情感风格"的语音。GPT-4o还改进了ChatGPT的视觉功能。有了照片或桌面屏幕，ChatGPT现在可以快速回答相关问题，从"这个软件代码是怎么回事"到"这个人穿的是什么牌子的衬衫？其他方面，OpenAI将发布桌面版ChatGPT和全新的用户界面。穆拉提说："我们知道这些模型越来越复杂，但我们希望交互体验变得更自然、更简单，让你完全不用关注用户界面，而只关注与[GPT]的协作。"...PC版：https://www.cnbeta.com.tw/articles/soft/1430761.htm手机版：https://m.cnbeta.com.tw/view/1430761.htm

OpenAI 探索用 GPT-2 小模型监督 GPT-4 大模型，防止 AI 毁灭人类

OpenAI探索用GPT-2小模型监督GPT-4大模型，防止AI毁灭人类Ilya领衔的OpenAI对齐团队，发表了——用类似GPT-2监督GPT-4的方法，或可帮人类搞定自己更聪明的超级AI！团队声称，已经发现了对超人类模型进行实证对齐的新研究方向。未来超级AI系统对齐的一个核心挑战——人类需要监督比自己更聪明人工智能系统。来源，频道：@kejiqu群组：@kejiquchat

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人