ChatGPT 的数学成绩更差了

ChatGPT 的数学成绩更差了 研究人员给聊天机器人布置了一项基本任务:识别某个数字是否是质数。这种数学问题对人来说很复杂,但对电脑来说却很简单。研究人员向 ChatGPT 输送了 1000 个不同的数字。三月份,GPT-4 能正确识别 84% 的数字是否为质数。(坦率地说,对于一台计算机来说,这样的表现非常一般。)到了六月份,它的成功率下降到了 51%。在 8 项不同的任务中,GPT-4 有 6 项变得更糟。这种退化是人工智能开发人员所熟知的漂移现象的一个例子,即试图改进极其复杂的人工智能模型的一部分,却使模型的其他部分表现更差。来源 ,附: 频道:@kejiqu 群组:@kejiquchat 投稿:@kejiqubot

相关推荐

封面图片

OpenAI最新GPT-4 Turbo模型让ChatGPT“更直接,更简洁”

OpenAI最新GPT-4 Turbo模型让ChatGPT“更直接,更简洁” OpenAI 声称,这个新模型("gpt-4-turbo-2024-04-09")在写作、数学、逻辑推理和编码方面都有所改进,而且知识库也更新了。与 ChatGPT 中的上一版 GPT-4 Turbo(截止日期为 2023 年 4 月)不同的是,它是根据截至 2023 年 12 月的公开数据进行训练的。OpenAI在X上的一篇文章中写道:"在使用ChatGPT(新版GPT-4 Turbo)写作时,回复会更直接、更少啰嗦,使用的对话语言也会更多。"在 ChatGPT 更新之前,OpenAI 于本周二发布了其 API 中的新模型,特别是 GPT-4 Turbo with Vision,它为通常只提供文本功能的 GPT-4 Turbo 增加了图像理解功能。《The Intercept》的报道显示,微软将 OpenAI 的 DALL-E 文本到图像模型作为战场工具推荐给了美国军方。此外,根据《The Information》的一篇报道,OpenAI最近解雇了两名研究人员,其中包括首席科学家伊利亚-苏茨克沃(Ilya Sutskever)的一名盟友,而苏茨克沃正是去年年底推动首席执行官萨姆-阿尔特曼下台的人之一。 ... PC版: 手机版:

封面图片

新版 GPT-4 Turbo 现已向付费 ChatGPT 用户开放

新版 GPT-4 Turbo 现已向付费 ChatGPT 用户开放 人工智能公司 OpenAI 今日 (12日) 宣布,新版 GPT-4 Turbo 现已向付费 ChatGPT 用户开放。新版本提高了写作、数学、逻辑推理和编码方面的能力。OpenAI 表示,例如“当使用 ChatGPT 进行写作时,回复将更加直接、不那么冗长,并且使用更多的对话语言。”承诺“将继续投入精力来改进模型”。GPT-4 Turbo 可在 ChatGPT Plus、Team、Enterprise 和 API 中使用。

封面图片

OpenAI 因企业版 ChatGPT 的“巨大增长”而开启新的“企业之年”

OpenAI 因企业版 ChatGPT 的“巨大增长”而开启新的“企业之年” OpenAI 首席运营官 Brad Lightcap 表示,目前已有超过 60 万人注册使用 ChatGPT Enterprise,而 1 月份这一数字约为 15 万人。尽管 OpenAI 面临着越来越多的 AI 公司提供的类似产品,但仍看到对企业版 ChatGPT 的需求激增。Lightcap 表示,2024 年是 OpenAI 的 “企业之年”,“我们越来越感觉到,市场正在将我们拉向真正的应用,通过真正广泛地关注人工智能实现来提供真正的业务成果,我们已准备好为客户提供支持。” OpenAI 还正式宣布了辅助微调,OpenAI 员工将帮助客户对 GPT-4 进行微调。定制模型计划允许选定的组织与 OpenAI 研究人员合作,根据他们的特定需求训练定制的 GPT-4 模型。

封面图片

AIGC Weekly #14更新了,上周又是疯狂的一周,本期主要介绍了我如何用GPT-4帮忙构建自动化程序,ChatGPT插件

AIGC Weekly #14更新了,上周又是疯狂的一周,本期主要介绍了我如何用GPT-4帮忙构建自动化程序,ChatGPT插件系统等其他动态、一堆非常值得阅读的内容。下面是上周一些行业动态和产品推荐,更多详细的内容可以去图里的竹白查看: 本周精选: 我在GPT-4的帮助下创建了一个自动信息收集机器人: Open AI 发布 ChatGPT插件系统: 这里加入等待列表: 这篇文章详细测试了ChatGPT插件系统的能力: lencx写的插件开发指南: Wolfram插件使ChatGPT的数学能力达到了匪夷所思的地步: Github 发布 GitHub Copilot X: Copilot Chat:不仅仅是一个聊天窗口。它可以识别开发人员键入的代码、显示的错误消息,并将其深度嵌入到 IDE 中。

封面图片

ℹChatGPT 的 GPT-4 变笨了?越来越多网友反应回复品质下降,产生很多错误代码#

ℹChatGPT 的 GPT-4 变笨了?越来越多网友反应回复品质下降,产生很多错误代码# 还记得 ChatGPT 推出 GPT-4 模型时,那时回复的内容真的让人惊艳,比 GPT-3.5 好太多,不过不知道是不是 iOS 行动版...

封面图片

学编程会拉低数学成绩,巴黎大学跟踪 1500 个小学生得出结论

学编程会拉低数学成绩,巴黎大学跟踪 1500 个小学生得出结论 “怎么培养数学逻辑思维?来点编程试试?”大概这是很多人的既有认知,毕竟感觉程序员们的数学都挺好的。 巴特,反转来了。来自巴黎大学的研究人员发现,小学生改用编程课学数学后,对成绩不仅没有明显帮助,甚至会产生一些负面影响。 在欧几里得除法、加法分解、分数运算几个方面,影响范围为-0.16 ~ -0.21(值为负数即代表表现不如标准组)。而且编程软件的可视化界面,还影响了孩子的注意力集中能力... 来自:雷锋 频道:@kejiqu 群组:@kejiquchat 投稿:@kejiqubot

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人