国泰君安：OpenAI 发布 GPT-4o，AI 交互迎来革新

国泰君安：OpenAI发布GPT-4o，AI交互迎来革新国泰君安研报表示，GPT-4o作为基础性工具为更多创新应用提供了生长土壤。ChatGPT拥有全球最广泛的大模型用户基数，每周有超1亿人使用ChatGPT，GPT-4o的文本和图像功能免费推出或将进一步夯实用户基础。我们认为，对图像和视频的理解和高效的实时互动，一定程度对其他单一功能的AI软件有替代的可能性，GPTStore有望推出更多便捷应用，丰富应用商城生态。同时随着GPT在桌面端和移动端的持续渗透，AI助理应用有望更快普及，新型商业模式或将逐步推出。

在Telegram中查看

相关推荐

国泰君安：高通和苹果有望引领 AI 终端时代供应链将深度收益

国泰君安：高通和苹果有望引领AI终端时代供应链将深度收益国泰君安发布研究报告称，诸如AIPC、AI手机等终端的硬件形态均为现成，AI终端的落地速度主要由AI模型的能力和意愿决定。以GPT-4o与Gemini为典型，其展示了有情绪的自然语音交互，以及对现实世界的识别。以WindowsCopilot为例，其展示了对系统及文件的管理。AI模型的能力已经达到端侧应用的临界点。此外，高通和苹果有望进一步引领AI终端时代，供应链将深度收益。推荐标的立讯精密(002475.SZ)、鹏鼎控股(002938.SZ);受益标的世华科技(688093.SH)。

今天发布的GPT-4o以及ChatGPT产品的快速总结：#ai# #open#

今天发布的GPT-4o以及ChatGPT产品的快速总结：#ai##openai#GPT-4o（“o”代表“全能”）它可以接受任意组合的文本、音频和图像作为输入，并生成任意组合的文本、音频和图像输出。它可以在232毫秒内响应音频输入，平均为320毫秒，这与人类在对话中的响应时间相似。在英文和代码文本方面，它与GPT-4Turbo的性能相当，对非英语文本的文本有显著改进。同时在API方面更快速、价格更便宜50%。与现有模型相比，GPT-4o在视觉和音频理解方面表现特别出色。与GPT-4Turbo相比，GPT-4o速度提高了2倍，价格减半，限制速率提高了5倍。何时可用？GPT-4o的文本和图像功能今天开始在ChatGPT中推出。将在免费版中提供GPT-4o，并为Plus用户提供高达5倍的消息限制。将在未来几周内在ChatGPTPlus中推出带有GPT-4o的VoiceMode的新版本。开发者现在也可以通过API访问GPT-4o作为文本和视觉模型。公告地址：https://openai.com/index/hello-gpt-4o/

中信建投：OpenAI 发布 GPT-4o，AGI 向前一步

中信建投：OpenAI发布GPT-4o，AGI向前一步中信建投研报表示，OpenAI举行春季发布会，重点发布GPT-4o大模型，性能达到GPT-4Turbo水平，能够实现多模态实时交互。同时，GPT-4o、ChatGPT会员版等多项功能未来将对所有用户免费开放，并推出桌面及手机双端应用，有望凭借易用性持续提升用户量。我们认为，OpenAI模型再次升级，重点发力多模态领域，且免费使用有望推动AI产业加速发展。

一文看懂 OpenAI 春季发布会：正式发布 GPT-4o！完全免费、无障碍与人交谈实时语音视频交互震撼全场

一文看懂OpenAI春季发布会：正式发布GPT-4o！完全免费、无障碍与人交谈实时语音视频交互震撼全场北京时间周二（5月14日）凌晨，美国人工智能研究公司OpenAI在线上举办了“春季更新”活动。整体来看，活动主要分为两大部分：推出新旗舰模型“GPT-4o”，以及在ChatGPT中免费提供更多功能。①OpenAI在活动中发布了新旗舰模型“GPT-4o”，“可以实时对音频、视觉和文本进行推理。”据介绍，新模型使ChatGPT能够处理50种不同的语言，同时提高了速度和质量。②OpenAI称，GPT-4o是迈向更自然人机交互的一步，它可以接受文本、音频和图像三者组合作为输入，并生成文本、音频和图像的任意组合输出，“与现有模型相比，GPT-4o在图像和音频理解方面尤其出色。”③在GPT-4o之前，用户使用语音模式与ChatGPT对话时，GPT-3.5的平均延迟为2.8秒，GPT-4为5.4秒。与之相比，GPT-4o可以在232毫秒内对音频输入做出反应，与人类在对话中的反应时间相近。④图像输入方面，演示视频显示，OpenAI高管启动摄像头要求实时完成一个一元方程题，ChatGPT轻松完成了任务；另外，高管还展示了ChatGPT桌面版对代码和电脑桌面（一张气温图表）进行实时解读的能力。⑤性能方面，根据传统基准测试，GPT-4o在文本、推理和编码等方面实现了与GPT-4Turbo级别相当的性能，同时在多语言、音频和视觉功能方面的表现分数也创下了新高。⑥更多工具免费解锁。OpenAI表示，“我们开始向ChatGPTPlus和Team用户推出GPT-4o，并且很快就会向企业用户推出。我们今天还开始推出ChatGPTFree，但有使用限额。Plus用户的消息限额将比免费用户高出5倍，团队和企业用户的限额会再高一些。”即使是ChatGPTFree（免费）用户也可以有机会体验GPT-4o，但当达到限额时，ChatGPT将自动切换到GPT-3.5。⑦OpenAI还推出适用于macOS的ChatGPT桌面应用程序，通过简单的键盘快捷键（Option+Space）可以立即向ChatGPT提问，还可以直接在应用程序中截取屏幕截图与机器人进行讨论。

OpenAI发布最新旗舰生成式AI模型GPT-4o 改进文本、视觉和音频功能

OpenAI发布最新旗舰生成式AI模型GPT-4o改进文本、视觉和音频功能穆拉提在OpenAI办公室举行的主题演讲上说：GPT-4o的理由横跨语音、文本和视觉。OpenAI将发布桌面版ChatGPT和全新的用户界面。穆拉提说："我们知道这些模型越来越复杂，但我们希望交互体验变得更自然、更简单，让你完全不用关注用户界面，而只关注与GPT的协作。这一点非常重要，因为我们正在展望人类与机器之间互动的未来。"GPT-4是OpenAI之前的领先模型，它是图像和文本的结合体，可以分析图像和文本，完成从图像中提取文本甚至描述图像内容等任务。但GPT-4o增加了语音功能。这具体能带来什么？很多方面。GPT-4o极大地改善了ChatGPT的体验--ChatGPT是OpenAI的病毒式人工智能聊天机器人。ChatGPT长期以来一直提供语音模式，使用文本到语音模式转录ChatGPT中的文本。但GPT-4o对此进行了改进，让用户可以更像使用助手一样与ChatGPT互动。例如，用户可以向由GPT-4o支持的ChatGPT提问，并在ChatGPT回答时打断它。OpenAI表示，该模型能提供"实时"响应，甚至能捕捉用户声音中的情感，并生成"一系列不同情感风格"的语音。GPT-4o还改进了ChatGPT的视觉功能。有了照片或桌面屏幕，ChatGPT现在可以快速回答相关问题，从"这个软件代码是怎么回事"到"这个人穿的是什么牌子的衬衫？其他方面，OpenAI将发布桌面版ChatGPT和全新的用户界面。穆拉提说："我们知道这些模型越来越复杂，但我们希望交互体验变得更自然、更简单，让你完全不用关注用户界面，而只关注与[GPT]的协作。"...PC版：https://www.cnbeta.com.tw/articles/soft/1430761.htm手机版：https://m.cnbeta.com.tw/view/1430761.htm

国泰君安：大模型开源路线得到确认，AI 应用场景创新迎来催化

国泰君安：大模型开源路线得到确认，AI应用场景创新迎来催化国泰君安研报表示，Meta推出其最新版本的人工智能开源大语言模型Llama3，包括8B和70B参数的两个版本，多项关键基准测试的表现优于诸多同类模型。随着未来400B参数的大版本模型Llama3的推出，开源社区有望迎来巨大变革，AI创新应用有望加速落地。当前大模型技术路线存在OpenAI为代表的闭源阵营和Llama为代表的开源阵营，此次Llama3在模型参数较小的情况下还能实现性能的显著优势，进一步肯定了开源的技术路线和Llama的训练框架。模型使用效率的提升也将调动周边的工具类应用，AI应用场景创新有望取得进一步突破。

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人