OpenAI开始在ChatGPT中推出语音和图像功能

据报道，OpenAI将在#ChatGPT中推出新的语音和图像功能。

【OpenAI将在ChatGPT推出新的语音和图像功能】2023年09月25日08点41分老不正经报道，OpenAI在官网宣布，

ChatGPT推出语音和图像功能现在可以用不同形式的命令向AI提问

ChatGPT推出语音和图像功能现在可以用不同形式的命令向AI提问据OpenAI称，新功能将在未来两周内向付费使用ChatGPT的用户推出，"不久之后"其他用户也将获得新功能。语音聊天部分让人非常熟悉：你点击一个按钮并说出你的问题，ChatGPT会将其转换为文本并将其输入大型语言模型，然后得到答案，再将其转换为语音，并大声说出答案。这种感觉就像与Alexa或Google助手交谈一样，只是OpenAI希望，由于底层技术的改进，答案会更好。大多数虚拟助手似乎都在依靠LLM进行改造，而OpenAI则走在了前面。OpenAI出色的Whisper模型完成了大量的语音转文本工作，而且该公司正在推出一种新的文本转语音模型，据称它可以"通过文本和几秒钟的语音样本生成类似人类的音频"。你可以从五个选项中选择ChatGPT的声音，但OpenAI似乎认为该模型的潜力远不止于此。例如，OpenAI正在与Spotify合作，将播客翻译成其他语言，同时保持播客的声音。合成语音有很多有趣的用途，OpenAI可以成为该行业的重要组成部分。但事实上，只需几秒钟的音频就能建立一个有能力的合成语音，这也为各种有问题的用例打开了大门。该公司在一篇宣布新功能的博文中说："这些功能也带来了新的风险，比如恶意行为者有可能冒充公众人物或实施欺诈。正是出于这个原因，OpenAI才没有广泛使用这种模式：它将受到更严格的控制，并仅限于特定的使用案例和合作关系。"与此同时，图片搜索有点像GoogleLens。你只需拍下感兴趣的照片，ChatGPT就会找出你的问题所在，并做出相应的回应。你还可以使用该应用的绘图工具来帮助清楚地表达你的疑问，或者根据图片说出或输入问题。这就是ChatGPT来来回回的特性所带来的帮助：你可以一边提示机器人，一边完善答案，而不是先搜索，得到错误答案后再搜索。(这与Google在多模态搜索方面的做法很相似）。显然，图像搜索也有其潜在的问题。其一是当你向聊天机器人提示一个人时，可能会发生什么：OpenAI表示，出于准确性和隐私方面的考虑，它有意限制了ChatGPT"分析和直接陈述人的能力"。这意味着人工智能最科幻的愿景之一--看着一个人说："那是谁？-这种能力不会很快实现。这也许是件好事。在ChatGPT首次发布近一年后，OpenAI似乎仍在努力探索如何为其机器人提供更多特性和功能，同时又不带来新的问题和弊端。在这些版本中，该公司试图通过故意限制其新机型的功能来实现这一目标。但这种方法不会永远奏效。随着越来越多的人使用语音控制和图像搜索，随着ChatGPT逐步成为一个真正多模式、实用的虚拟助手，要想继续保持护栏就会越来越难。...PC版：https://www.cnbeta.com.tw/articles/soft/1386261.htm手机版：https://m.cnbeta.com.tw/view/1386261.htm

OpenAI推出ChatGPT语音功能并就其公司内斗开了个玩笑

OpenAI推出ChatGPT语音功能并就其公司内斗开了个玩笑今年9月，OpenAI首次推出了用语音和图像提示ChatGPT的功能，但该功能只对付费用户开放。该功能发布之际，OpenAI的员工正在为其首席执行官的突然下台而苦苦挣扎，同时也在为他的回归进行混乱的谈判。OpenAI在X上发布的演示甚至还拿正在进行的这场闹剧开了个玩笑，这场闹剧在过去几天里一直持续到深夜。在这个例子中，有人问ChatGPT："对团队来说，这是一个漫长的夜晚，我们饿了。我应该为778人点多少份16英寸的披萨？"OpenAI拥有大致相同数量的员工，其中大部分人最近威胁说，除非整个董事会辞职，否则他们就辞职。上周，OpenAI董事会解雇了联合创始人兼首席执行官山姆-阿尔特曼（SamAltman），因为董事会成员发现"他在与董事会的沟通中没有始终保持坦诚"。此后，微软首席执行官萨提亚-纳德拉（SatyaNadella）邀请阿尔特曼和他的团队成员在这家科技巨头成立一个新部门，但阿尔特曼可能会重返OpenAI。前OpenAI总裁格雷格-布罗克曼（GregBrockman）在奥特曼下台后辞职，他在X上转发了OpenAI的公告，并表示："试一试吧--完全改变了ChatGPT的体验。"值得注意的是，Brockman也对重返OpenAI持开放态度。...PC版：https://www.cnbeta.com.tw/articles/soft/1398839.htm手机版：https://m.cnbeta.com.tw/view/1398839.htm

OpenAI 推迟发布 ChatGPT 的语音助手功能

OpenAI推迟发布ChatGPT的语音助手功能OpenAI推迟发布备受期待的ChatGPT语音助手功能，以确保它能够安全有效地处理来自数百万用户的请求。该公司在5月份的产品发布会上为GPT-4o推出了语音选项。OpenAI表示，它原本打算在6月底向一小部分付费ChatGPTplus用户推出语音功能，但后来认为还需要一个月的时间才能“达到我们的标准”。“我们正在提高该模型检测和拒绝某些内容的能力，”该公司周二表示。此举意味着OpenAI可能遭遇挫折，该公司正努力在日益激烈的人工智能竞争中保持领先地位。

OpenAI开始在ChatGPT中推出语音和图像功能

相关推荐

据报道，OpenAI将在#ChatGPT中推出新的语音和图像功能。

【OpenAI将在ChatGPT推出新的语音和图像功能】2023年09月25日08点41分老不正经报道，OpenAI在官网宣布，

ChatGPT推出语音和图像功能现在可以用不同形式的命令向AI提问

OpenAI推出ChatGPT语音功能并就其公司内斗开了个玩笑

OpenAI 推迟发布 ChatGPT 的语音助手功能

OpenAI推出ChatGPT-4：可同时解析文本和图像，支持微软新款必应

相关推荐

据报道，OpenAI将在#ChatGPT中推出新的语音和图像功能。

【OpenAI将在ChatGPT推出新的语音和图像功能】2023年09月25日08点41分老不正经报道，OpenAI在官网宣布，

ChatGPT推出语音和图像功能 现在可以用不同形式的命令向AI提问

OpenAI推出ChatGPT语音功能 并就其公司内斗开了个玩笑

OpenAI 推迟发布 ChatGPT 的语音助手功能

OpenAI推出ChatGPT-4：可同时解析文本和图像，支持微软新款必应

ChatGPT推出语音和图像功能现在可以用不同形式的命令向AI提问

OpenAI推出ChatGPT语音功能并就其公司内斗开了个玩笑