GPT 4o意味着什么?科学家Jim Fan:OpenAI加苹果 AI手机势不可挡

GPT4o意味着什么?科学家JimFan:OpenAI加苹果AI手机势不可挡从定位来看,全新的旗舰版本GPT-4o似乎正在挑战Siri。实则不然。就在此前,有媒体报道透露,苹果已经与OpenAI达成协议,将在全新操作系统iOS18中引入ChatGPT技术,以升级Siri的对话体验。这不由令人猜想,GPT-4o和Siri将如何结合?ChatGPT和苹果又将如何定义新一代AI手机?GPT-4o升级在哪?1)融媒能力:GPT-4o同时具备文本、图片、视频、音频多方面的能力,即可以接受任何文本、音频等形式及其组合的输入,并生成同样媒介形式的回答。2)速度更快:GPT-4o的速度是上一代的5倍,语音延迟大幅改善,可以在232毫秒内回应音频输入,平均为320毫秒,接近人类对话的反应时间。这意味用户可以和GPT-4o实时对话、甚至直接打视频让Ta在线解答各种问题。3)免费开放:尽管“价格战”的风还是吹到了AI界,但OpenAI显然不买账——发布会即日起,GPT-4o将面向ChatGPT的所有付费和免费用户发布,取消其他所有限制,API价格降价50%。正如发布会所说,GPT-4o中的“o”代表“omni”,意为全能,从目前的功能更新来看,得到全栈优化的全新GPT-4o真正成为了一款AI实时语音助手,性能远超Siri。演示中,GPT-4o还展现出宣传点之外的小功能,但惊喜程度不亚于前者:能够实时翻译、识别表情,可以通过摄像头识别画面写代码分析图表。“苹果+OpenAI”将如何定义AI手机?因下一代iPhone操作系统计划发布基于LLM(大型语言模型)的新功能,苹果正就此寻找第三方合作伙伴,谈判对象包括Google、OpenAI。就目前看来,苹果和OpenAI的适配度似乎更高。有分析指出,苹果和OpenAI的合作能够解决彼此在发展边缘AI方面的痛点,真正做到各取所需——OpenAI最需要什么?端侧应用权限、系统级权限,只有苹果能提供。苹果最需要什么?最好的AI技术,最适配的大语言模型,GPT-4o无疑是最佳人选。况且,苹果在自研芯片、封闭生态系统上还具有独特优势。正如英伟达高级研究科学家JimFan在X平台的评论:谁先赢得苹果,谁就赢得了胜利。我认为与iOS的集成将出现3个层级:1)放弃Siri。OpenAI为iOS提炼出更小型、纯设备上的GPT-4o,并可选择付费升级以使用云。2)将相机或屏幕传输到模型中的本机功能。对神经音频/视频编解码器的芯片级支持。3)集成iOS系统操作API和智能家居API。Siri快捷方式是时候复活了。这可能会成为从一开始就拥有10亿用户的AI产品,OpenAI之于苹果类似于“用于智能手机的FSD”。进一步展望,ChatGPT引入iPhone能创造怎样的新增长故事?Wedbush分析师Dan Ives在周一的一份报告表示:“在iPhone16中嵌入OpenAI聊天框也将开辟新的增长途径,这将让重要的开发者以及微软开发者生态系统一起涌入苹果生态系统。从本质上讲,与OpenAI建立紧密的合作关系将改变游戏规则,而对于微软/OpenAI来说,与全球最大的电子消费品牌捆绑将是一个明智的选择。”Ives预计,苹果将在6月10日的WWDC大会上官宣和OpenAI的合作伙伴关系,并推出基于苹果LLM的AI聊天机器人。...PC版:https://www.cnbeta.com.tw/articles/soft/1430816.htm手机版:https://m.cnbeta.com.tw/view/1430816.htm

相关推荐

封面图片

苹果宣布与OpenAI达成合作 从GPT-4o开始集成ChatGPT

苹果宣布与OpenAI达成合作从GPT-4o开始集成ChatGPT在苹果公司努力整合人工智能功能以媲美其他大型科技公司之际,出现了我们期待已久的合作关系。苹果公司在周一举行的WWDC2024主题演讲上宣布,将与OpenAI合作集成ChatGPT,从GPT-4o开始。苹果公司一直在与Google和OpenAI讨论,希望将它们的人工智能技术整合到其操作系统中。最终,OpenAI与其达成了协议。有人猜测,OpenAI最近推出的语音助手GPT-4o(因声音酷似电影《她》中的斯嘉丽-约翰逊而备受批评)是为了展示OpenAI的技术如何能够增强苹果的Siri。在这次合作中,苹果公司宣布了一系列新的人工智能功能,这些功能被称为"苹果智能"(AppleIntelligence)。iPhone可以在应用程序中为你采取行动,Siri的功能将得到全面提升,还有人工智能写作工具,而所有这些都将保持苹果公司的核心数据隐私理念。ChatGPT4o将于"今年晚些时候"登陆iOS、macOS和iPadOS,它是Siri在无法满足你的要求时可以求助的聊天机器人。苹果表示,当它这样做时,会先征求你的同意。苹果表示,它将从最好的聊天机器人开始,但也会支持其他人工智能模型。...PC版:https://www.cnbeta.com.tw/articles/soft/1434271.htm手机版:https://m.cnbeta.com.tw/view/1434271.htm

封面图片

OpenAI 推出 GPT-4o Mini 模型

OpenAI推出GPT-4oMini模型OpenAI将于周四晚些时候推出一款新的AI模型“GPT-4omini”,该公司称新发布的模型是“当今最强大、最具成本效益的小型模型”,这款迷你AI模型是GPT-4o的一个分支,并计划稍后将图像、视频和音频集成到其中。GPT-4omini将于周四晚些时候向ChatGPT免费用户以及ChatGPTPlus和Team订阅者开放,并将于下周向ChatGPTEnterprise用户开放。——

封面图片

OpenAI 发布 GPT-4o mini

OpenAI发布GPT-4ominiOpenAI推出其最新的AI模型“GPT-4omini”。该模型被称为目前最具能力且成本效益最高的小型模型,并计划未来集成图像、视频和音频功能。GPT-4omini是GPT-4o的衍生版本。将在本周四向ChatGPT免费用户、ChatGPTPlus和团队用户开放,下周向企业用户开放。关注频道@ZaiHuaPd投稿爆料@ZaiHuabot

封面图片

OpenAI发布最新旗舰生成式AI模型GPT-4o 改进文本、视觉和音频功能

OpenAI发布最新旗舰生成式AI模型GPT-4o改进文本、视觉和音频功能穆拉提在OpenAI办公室举行的主题演讲上说:GPT-4o的理由横跨语音、文本和视觉。OpenAI将发布桌面版ChatGPT和全新的用户界面。穆拉提说:"我们知道这些模型越来越复杂,但我们希望交互体验变得更自然、更简单,让你完全不用关注用户界面,而只关注与GPT的协作。这一点非常重要,因为我们正在展望人类与机器之间互动的未来。"GPT-4是OpenAI之前的领先模型,它是图像和文本的结合体,可以分析图像和文本,完成从图像中提取文本甚至描述图像内容等任务。但GPT-4o增加了语音功能。这具体能带来什么?很多方面。GPT-4o极大地改善了ChatGPT的体验--ChatGPT是OpenAI的病毒式人工智能聊天机器人。ChatGPT长期以来一直提供语音模式,使用文本到语音模式转录ChatGPT中的文本。但GPT-4o对此进行了改进,让用户可以更像使用助手一样与ChatGPT互动。例如,用户可以向由GPT-4o支持的ChatGPT提问,并在ChatGPT回答时打断它。OpenAI表示,该模型能提供"实时"响应,甚至能捕捉用户声音中的情感,并生成"一系列不同情感风格"的语音。GPT-4o还改进了ChatGPT的视觉功能。有了照片或桌面屏幕,ChatGPT现在可以快速回答相关问题,从"这个软件代码是怎么回事"到"这个人穿的是什么牌子的衬衫?其他方面,OpenAI将发布桌面版ChatGPT和全新的用户界面。穆拉提说:"我们知道这些模型越来越复杂,但我们希望交互体验变得更自然、更简单,让你完全不用关注用户界面,而只关注与[GPT]的协作。"...PC版:https://www.cnbeta.com.tw/articles/soft/1430761.htm手机版:https://m.cnbeta.com.tw/view/1430761.htm

封面图片

今天发布的GPT-4o以及ChatGPT产品的快速总结:#ai# #open#

今天发布的GPT-4o以及ChatGPT产品的快速总结:#ai##openai#GPT-4o(“o”代表“全能”)它可以接受任意组合的文本、音频和图像作为输入,并生成任意组合的文本、音频和图像输出。它可以在232毫秒内响应音频输入,平均为320毫秒,这与人类在对话中的响应时间相似。在英文和代码文本方面,它与GPT-4Turbo的性能相当,对非英语文本的文本有显著改进。同时在API方面更快速、价格更便宜50%。与现有模型相比,GPT-4o在视觉和音频理解方面表现特别出色。与GPT-4Turbo相比,GPT-4o速度提高了2倍,价格减半,限制速率提高了5倍。何时可用?GPT-4o的文本和图像功能今天开始在ChatGPT中推出。将在免费版中提供GPT-4o,并为Plus用户提供高达5倍的消息限制。将在未来几周内在ChatGPTPlus中推出带有GPT-4o的VoiceMode的新版本。开发者现在也可以通过API访问GPT-4o作为文本和视觉模型。公告地址:https://openai.com/index/hello-gpt-4o/

封面图片

一文看懂 OpenAI 春季发布会:正式发布 GPT-4o! 完全免费、无障碍与人交谈 实时语音视频交互震撼全场

一文看懂OpenAI春季发布会:正式发布GPT-4o!完全免费、无障碍与人交谈实时语音视频交互震撼全场北京时间周二(5月14日)凌晨,美国人工智能研究公司OpenAI在线上举办了“春季更新”活动。整体来看,活动主要分为两大部分:推出新旗舰模型“GPT-4o”,以及在ChatGPT中免费提供更多功能。①OpenAI在活动中发布了新旗舰模型“GPT-4o”,“可以实时对音频、视觉和文本进行推理。”据介绍,新模型使ChatGPT能够处理50种不同的语言,同时提高了速度和质量。②OpenAI称,GPT-4o是迈向更自然人机交互的一步,它可以接受文本、音频和图像三者组合作为输入,并生成文本、音频和图像的任意组合输出,“与现有模型相比,GPT-4o在图像和音频理解方面尤其出色。”③在GPT-4o之前,用户使用语音模式与ChatGPT对话时,GPT-3.5的平均延迟为2.8秒,GPT-4为5.4秒。与之相比,GPT-4o可以在232毫秒内对音频输入做出反应,与人类在对话中的反应时间相近。④图像输入方面,演示视频显示,OpenAI高管启动摄像头要求实时完成一个一元方程题,ChatGPT轻松完成了任务;另外,高管还展示了ChatGPT桌面版对代码和电脑桌面(一张气温图表)进行实时解读的能力。⑤性能方面,根据传统基准测试,GPT-4o在文本、推理和编码等方面实现了与GPT-4Turbo级别相当的性能,同时在多语言、音频和视觉功能方面的表现分数也创下了新高。⑥更多工具免费解锁。OpenAI表示,“我们开始向ChatGPTPlus和Team用户推出GPT-4o,并且很快就会向企业用户推出。我们今天还开始推出ChatGPTFree,但有使用限额。Plus用户的消息限额将比免费用户高出5倍,团队和企业用户的限额会再高一些。”即使是ChatGPTFree(免费)用户也可以有机会体验GPT-4o,但当达到限额时,ChatGPT将自动切换到GPT-3.5。⑦OpenAI还推出适用于macOS的ChatGPT桌面应用程序,通过简单的键盘快捷键(Option+Space)可以立即向ChatGPT提问,还可以直接在应用程序中截取屏幕截图与机器人进行讨论。

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人