性能远低于预期 OpenAI据称放弃开发廉价版GPT-4 Arrakis

性能远低于预期OpenAI据称放弃开发廉价版GPT-4Arrakis按照OpenAI的设计初衷,Arrakis将具有与GPT-4一样的能力,但部署成本更低,因为它的部分设计采用了所谓的“分散”原则。这意味着,只有神经网络的一部分被用来处理用户输入。而在传统的“密集模型”中,整个神经网络都是活跃的。当前,谷歌的PathAI项目就使用了“分散”原则。但两位知情人士今日称,OpenAI于今年年中取消了Arrakis项目,因为该模型的运行效率并没有预期的那样高。OpenAI的开发团队意识到,Arrakis的性能远不及GPT-4。目前尚不清楚,为什么“分散”原则在早期的测试中效表现良好,但在后来的开发中却失败了。当前的大语言模型,即生成式人工智能,依赖于巨大的计算能力来运行其复杂的数学模型,企业必须购买大量的高性能芯片,成本非常高。因此,越来越多的公司,包括亚马逊、谷歌、阿里巴巴、Meta和OpenAI等,都在设计自己的特定人工智能芯片。但分析公司CCSInsight上周表示,生成式人工智能已被过度炒作。随着相关成本的增加,以及监管的呼声越来越高,这项新兴的技术将于2024年遇冷。...PC版:https://www.cnbeta.com.tw/articles/soft/1391067.htm手机版:https://m.cnbeta.com.tw/view/1391067.htm

相关推荐

封面图片

OpenAI 在东京开设亚洲首个办事处,将发布日语优化型 GPT-4 模型

OpenAI在东京开设亚洲首个办事处,将发布日语优化型GPT-4模型OpenAI今日宣布,公司在亚洲的首个办事处落户日本东京。OpenAI表示将致力于与当地政府、企业和研究机构合作,开发安全的人工智能工具,满足当地的独特需求。OpenAI还将发布针对日语进行优化的GPT-4定制模型。与GPT-4Turbo相比,它在日文文本方面的性能有所提高,运行速度最多可提高三倍。与此同时,该模型提高了翻译和总结日语文本的性能和成本效益。线索:@ZaiHuabot投稿:@TNSubmbot频道:@TestFlightCN

封面图片

GPT-4论文竟有隐藏线索:GPT-5或完成训练、OpenAI两年内接近AGI

GPT-4论文竟有隐藏线索:GPT-5或完成训练、OpenAI两年内接近AGI1.ARC(AlignmentResearchCenter)是一个非营利性研究机构,其使命是使未来的机器学习系统与人类利益保持一致。ARC的目标是训练AI模型,使其不会操纵、欺骗甚至伤害人类)。OpenAI曾经选择让ARC去测试评估GPT-4会不会主动避免自己被“挂掉”,说明此前必定出现过这种情况。OpenAICEOSamAltman认为人类需要对AI做更多的监管,以符合人类的利益。OpenAI担忧科技竞赛会导致安全标准的下降、不良规范的扩散、AI发展进程的加速,加剧与人工智能相关的社会风险。但是微软CEO和CTO希望OpenAI的模型能尽快让用户用起来。可以肯定的一点是OpenAI和微软在这件事的想法是相悖的。OpenAI雇佣了预测专家,来预测当他们部署了GPT-4之后会带来怎样的风险。“超级预测员”建议将GPT-4部署时间推迟6个月,也就是今年秋季左右;但很显然,OpenAI并没有采纳他们的建议。OpenAI这么做的原因,可能是来自微软的压力。2.OpenAI会协助超越它的公司:OpenAI做出了一个非常大胆的承诺:"如果另一家公司在我们之前实现了接近AGI(通用人工智能),那我们承诺不会跟它做竞争,相反,会协助完成那个项目。但这种情况发生的条件,可能是另一家公司需得在未来两年内,成功接近AGI的机会在一半或以上"而这里提到的AGI,OpenAI和Altam在官方博客中已经给出了定义——普遍比人类更聪明,并且有益于全人类的人工智能系统。3.GPT-4确实已经达到了人类的常识水平。博主在论文中找到了相关数据,在“人类”那一栏中,分数分布在了94-96.5之间。而GPT-4的95.3,便正好在这个区间之间。4.OpenAI在去年年底推出ChatGPT的时候,已经有了GPT-4。GPT-5可能已经完成训练5.像ChatGPT、GitHubCopilot这些工具导致某些工作的自动化。GPT-4的能力可以在某些特定领域中以人类10倍甚至更高的效率来完成。5.OpenAI让GPT-4学会拒绝的方法,叫做基于规则的奖励模型(RBRMs)。这种方法的工作流程:给GPT-4一组要遵守的原则,如果模型遵守了这些原则,那么就会提供相应的奖励。他认为OpenAI正在用人工智能的力量,让AI模型朝着符合人类原则的方向发展。()参考链接:[1]https://www.youtube.com/watch?v=ufQmq6X22rM[2]https://cdn.openai.com/papers/gpt-4.pdf投稿:@ZaiHuabot频道:@TestFlightCN

封面图片

OpenAI CEO 最新演讲:GPT-5 性能远超 GPT-4,保持迭代部署很重要

OpenAICEO最新演讲:GPT-5性能远超GPT-4,保持迭代部署很重要4月25日,OpenAI联合创始人兼首席执行官萨姆・奥尔特曼(SamAltman)在斯坦福大学发表演讲,提及AGI(通用人工智能)发展、OpenAI的迭代节奏等。有消息称,这场演讲在英伟达礼堂进行,超一千人在门口排队,热度颇高。"GPT-5会更加智能,这将是历史上最令人瞩目的事件之一。"在一段流出的视频中,奥尔特曼表示,以高度的科学确定性来说,GPT-5将比GPT-4智能很多,GPT-6将比GPT-5智能很多,而我们远未触及极限。此前OpenAI已推出GPT-3.5和GPT-4。对于OpenAI的产品迭代,奥尔特曼认为尽早且频繁推出AI产品,保持迭代部署非常重要,即便现在看来ChatGPT还有点令人尴尬,GPT-4还显得愚蠢。要让社会为技术进步做好准备,依赖于迭代部署。(第一财经)

封面图片

OpenAI强化GPT-4并使其更加便宜

OpenAI强化GPT-4并使其更加便宜该公司在周一举行的首次开发者大会上宣布,目前通过API预览版提供的GPT-4Turbo已对2023年4月之前的信息进行了培训。3月份发布的GPT-4早期版本只能学习到2021年9月之前的数据。OpenAI计划在未来几周内发布可量产的Turbo模型,但没有给出确切日期。GPT-4Turbo还能"看到"更多数据,其上下文窗口为128K,OpenAI称这"相当于在单个提示符中显示300多页文本"。一般来说,更大的上下文窗口可以让GPT等大型语言模型理解更多问题,并提供更深思熟虑的回答。在此之前,OpenAI发布了两个版本的GPT-4,一个版本的上下文窗口只有8K,另一个版本为32K。OpenAI表示,GPT-4Turbo对开发者来说运行成本更低。与GPT-4的0.03美元相比,每1000个标记(LLM阅读文本或代码的基本单位)的输入成本仅为0.01美元。每输出1000个单位的成本为0.03美元。总体而言,OpenAI表示新版GPT-4比旧版便宜三倍。最新版本的GPT-4仍将接受图像提示、文本到语音请求,并集成了10月份首次发布的DALL-E3功能。该公司表示,GPT-4Turbo的改进意味着用户可以在一次提示中要求模型执行更复杂的任务。用户甚至可以让GPT-4Turbo特别使用自己选择的编程语言来获取结果,比如XML或JSON编码。使用GPT-3.5Turbo模型的公司还将看到上下文窗口、功能和价格方面的改进。它的默认上下文窗口为16K,功能更新与GPT-4Turbo相同。GPT-3.5Turbo的输入费用为0.01美元,输出费用为0.002美元。OpenAI于3月发布了GPT-3.5Turbo,并称其为非聊天用途的最佳模型。8月,该公司又发布了一个可以微调的版本。除了改进旗舰模型,OpenAI还宣布效仿微软和Google,通过一项名为CopyrightShield的计划为企业用户提供版权赔偿。该公司在一份声明中说:"如果你面临有关版权侵权的法律索赔,我们现在将出面为我们的客户辩护,并支付由此产生的费用。"版权保护计划将涵盖ChatGPTEnterprise和OpenAI开发者平台的一般可用功能。Google表示,如果使用其嵌入式生成式人工智能功能的客户被起诉侵犯版权,公司将承担法律责任。微软也为其Copilot人工智能产品的企业用户提供了同样的保护。...PC版:https://www.cnbeta.com.tw/articles/soft/1394925.htm手机版:https://m.cnbeta.com.tw/view/1394925.htm

封面图片

阿里云发布通义千问2.5 称性能赶超GPT-4

阿里云发布通义千问2.5称性能赶超GPT-4中国云计算及人工智能科技公司阿里云发布聊天机器人通义千问2.5大模型,并称该模型性能全面赶超GPT-4。据第一财经报道,阿里云星期四(5月9日)正式发布通义千问2.5。该公司说,与通义千问2.1版本相比,通义千问2.5的理解能力、逻辑推理、指令遵循、代码能力分别提升9%、16%、19%、10%;与GPT-4相比,中文语境下,通义千问2.5文本理解、文本生成、知识问答及生活建议、闲聊及对话、安全风险等多项能力赶超GPT-4。阿里云称,随着通义千问2.5的发布,在权威基准OpenCompass上,该模型得分追平GPT-4Turbo,是中国国产大模型首次在该基准取得该项成绩。GPT-4Turbo是人工智能聊天机器人ChatGPT的研发公司OpenAI推出的最新大型语言模型。此前,中国人工智能巨头商汤科技4月也发布全新升级的日日新SenseNova5.0大模型。澎湃新闻报道,该模型采用混合专家架构(MoE),超10TBtokens训练,覆盖大量合成数据,推理时上下文窗口达200K左右,综合能力全面对标GPT-4Turbo。2024年5月9日7:30PM

封面图片

微软Azure OpenAI服务在公开预览版中增加了带视觉功能的GPT-4 Turbo

几周前,OpenAI在其首次开发者活动中发布了用于生成式人工智能服务的最新大型语言模型GPT-4Turbo。随后,微软宣布将把GPT-4Turbo模型添加到其AzureOpenAI服务中。今天,微软宣布增强其AzureOpenAI服务,GPT-4TurbowithVision模型现已作为公开预览版提供给客户。此外,微软还通过GPT-4TurbowithVision预览版为AzureOpenAI客户增加了更多功能。其中之一是光学字符识别(OCR),它可以检查图像并提取图像中的任何文本,以便将其整合到用户提示中。GPT-4TurbowithVision的另一项功能是对象接地,它可以让人工智能检查图像,并根据用户的文本提示显示图像中的关键对象。同样,人工智能还可以分析视频的特定帧。标签:#OpenAI#微软#Azure频道:@GodlyNews1投稿:@GodlyNewsBot

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人