#小众软件OpenAI发布新旗舰模型GPT-4o，实时处理音频、视觉和文本https://www.appinn.com/hell

OpenAI发布最新旗舰生成式AI模型GPT-4o 改进文本、视觉和音频功能

OpenAI发布最新旗舰生成式AI模型GPT-4o改进文本、视觉和音频功能穆拉提在OpenAI办公室举行的主题演讲上说：GPT-4o的理由横跨语音、文本和视觉。OpenAI将发布桌面版ChatGPT和全新的用户界面。穆拉提说："我们知道这些模型越来越复杂，但我们希望交互体验变得更自然、更简单，让你完全不用关注用户界面，而只关注与GPT的协作。这一点非常重要，因为我们正在展望人类与机器之间互动的未来。"GPT-4是OpenAI之前的领先模型，它是图像和文本的结合体，可以分析图像和文本，完成从图像中提取文本甚至描述图像内容等任务。但GPT-4o增加了语音功能。这具体能带来什么？很多方面。GPT-4o极大地改善了ChatGPT的体验--ChatGPT是OpenAI的病毒式人工智能聊天机器人。ChatGPT长期以来一直提供语音模式，使用文本到语音模式转录ChatGPT中的文本。但GPT-4o对此进行了改进，让用户可以更像使用助手一样与ChatGPT互动。例如，用户可以向由GPT-4o支持的ChatGPT提问，并在ChatGPT回答时打断它。OpenAI表示，该模型能提供"实时"响应，甚至能捕捉用户声音中的情感，并生成"一系列不同情感风格"的语音。GPT-4o还改进了ChatGPT的视觉功能。有了照片或桌面屏幕，ChatGPT现在可以快速回答相关问题，从"这个软件代码是怎么回事"到"这个人穿的是什么牌子的衬衫？其他方面，OpenAI将发布桌面版ChatGPT和全新的用户界面。穆拉提说："我们知道这些模型越来越复杂，但我们希望交互体验变得更自然、更简单，让你完全不用关注用户界面，而只关注与[GPT]的协作。"...PC版：https://www.cnbeta.com.tw/articles/soft/1430761.htm手机版：https://m.cnbeta.com.tw/view/1430761.htm

OpenAI发布GPT-4o全能模型实时语音和视觉能力

OpenAI 发布 GPT-4o mini

OpenAI发布GPT-4ominiOpenAI推出其最新的AI模型“GPT-4omini”。该模型被称为目前最具能力且成本效益最高的小型模型，并计划未来集成图像、视频和音频功能。GPT-4omini是GPT-4o的衍生版本。将在本周四向ChatGPT免费用户、ChatGPTPlus和团队用户开放，下周向企业用户开放。关注频道@ZaiHuaPd投稿爆料@ZaiHuabot

OpenAI 推出 GPT-4o Mini 模型

OpenAI推出GPT-4oMini模型OpenAI将于周四晚些时候推出一款新的AI模型“GPT-4omini”，该公司称新发布的模型是“当今最强大、最具成本效益的小型模型”，这款迷你AI模型是GPT-4o的一个分支，并计划稍后将图像、视频和音频集成到其中。GPT-4omini将于周四晚些时候向ChatGPT免费用户以及ChatGPTPlus和Team订阅者开放，并将于下周向ChatGPTEnterprise用户开放。——

OpenAI 发布替代 GPT-3.5 的 GPT-4o mini

OpenAI发布替代GPT-3.5的GPT-4ominiOpenAI发布了GPT-4o模型的小型版本GPT-4omini，它将取代GPT-3.5Turbo提供给所有ChatGPT用户，包括免费和付费用户。GPT-4omini类似GPT-4o，支持多模，能解释图像、文本和音频，能生成图像。GPT-4omini支持128K上下文令牌，其数据截至2023年10月，它的API费用比GPT-3.5Turbo低60%，每百万输入令牌15美分，每百万输出令牌60美分。GPT-4omini将使用名为instructionhierarchy的新技术，限制了越狱。来源，频道：@kejiqu群组：@kejiquchat