OpenAI开始在ChatGPT中推出语音和图像功能

None

相关推荐

封面图片

据报道,OpenAI将在#ChatGPT中推出新的语音和图像功能。

封面图片

【OpenAI将在ChatGPT推出新的语音和图像功能】2023年09月25日08点41分老不正经报道,OpenAI在官网宣布,

封面图片

ChatGPT推出语音和图像功能 现在可以用不同形式的命令向AI提问

ChatGPT推出语音和图像功能现在可以用不同形式的命令向AI提问据OpenAI称,新功能将在未来两周内向付费使用ChatGPT的用户推出,"不久之后"其他用户也将获得新功能。语音聊天部分让人非常熟悉:你点击一个按钮并说出你的问题,ChatGPT会将其转换为文本并将其输入大型语言模型,然后得到答案,再将其转换为语音,并大声说出答案。这种感觉就像与Alexa或Google助手交谈一样,只是OpenAI希望,由于底层技术的改进,答案会更好。大多数虚拟助手似乎都在依靠LLM进行改造,而OpenAI则走在了前面。OpenAI出色的Whisper模型完成了大量的语音转文本工作,而且该公司正在推出一种新的文本转语音模型,据称它可以"通过文本和几秒钟的语音样本生成类似人类的音频"。你可以从五个选项中选择ChatGPT的声音,但OpenAI似乎认为该模型的潜力远不止于此。例如,OpenAI正在与Spotify合作,将播客翻译成其他语言,同时保持播客的声音。合成语音有很多有趣的用途,OpenAI可以成为该行业的重要组成部分。但事实上,只需几秒钟的音频就能建立一个有能力的合成语音,这也为各种有问题的用例打开了大门。该公司在一篇宣布新功能的博文中说:"这些功能也带来了新的风险,比如恶意行为者有可能冒充公众人物或实施欺诈。正是出于这个原因,OpenAI才没有广泛使用这种模式:它将受到更严格的控制,并仅限于特定的使用案例和合作关系。"与此同时,图片搜索有点像GoogleLens。你只需拍下感兴趣的照片,ChatGPT就会找出你的问题所在,并做出相应的回应。你还可以使用该应用的绘图工具来帮助清楚地表达你的疑问,或者根据图片说出或输入问题。这就是ChatGPT来来回回的特性所带来的帮助:你可以一边提示机器人,一边完善答案,而不是先搜索,得到错误答案后再搜索。(这与Google在多模态搜索方面的做法很相似)。显然,图像搜索也有其潜在的问题。其一是当你向聊天机器人提示一个人时,可能会发生什么:OpenAI表示,出于准确性和隐私方面的考虑,它有意限制了ChatGPT"分析和直接陈述人的能力"。这意味着人工智能最科幻的愿景之一--看着一个人说:"那是谁?-这种能力不会很快实现。这也许是件好事。在ChatGPT首次发布近一年后,OpenAI似乎仍在努力探索如何为其机器人提供更多特性和功能,同时又不带来新的问题和弊端。在这些版本中,该公司试图通过故意限制其新机型的功能来实现这一目标。但这种方法不会永远奏效。随着越来越多的人使用语音控制和图像搜索,随着ChatGPT逐步成为一个真正多模式、实用的虚拟助手,要想继续保持护栏就会越来越难。...PC版:https://www.cnbeta.com.tw/articles/soft/1386261.htm手机版:https://m.cnbeta.com.tw/view/1386261.htm

封面图片

OpenAI推出ChatGPT语音功能 并就其公司内斗开了个玩笑

OpenAI推出ChatGPT语音功能并就其公司内斗开了个玩笑今年9月,OpenAI首次推出了用语音和图像提示ChatGPT的功能,但该功能只对付费用户开放。该功能发布之际,OpenAI的员工正在为其首席执行官的突然下台而苦苦挣扎,同时也在为他的回归进行混乱的谈判。OpenAI在X上发布的演示甚至还拿正在进行的这场闹剧开了个玩笑,这场闹剧在过去几天里一直持续到深夜。在这个例子中,有人问ChatGPT:"对团队来说,这是一个漫长的夜晚,我们饿了。我应该为778人点多少份16英寸的披萨?"OpenAI拥有大致相同数量的员工,其中大部分人最近威胁说,除非整个董事会辞职,否则他们就辞职。上周,OpenAI董事会解雇了联合创始人兼首席执行官山姆-阿尔特曼(SamAltman),因为董事会成员发现"他在与董事会的沟通中没有始终保持坦诚"。此后,微软首席执行官萨提亚-纳德拉(SatyaNadella)邀请阿尔特曼和他的团队成员在这家科技巨头成立一个新部门,但阿尔特曼可能会重返OpenAI。前OpenAI总裁格雷格-布罗克曼(GregBrockman)在奥特曼下台后辞职,他在X上转发了OpenAI的公告,并表示:"试一试吧--完全改变了ChatGPT的体验。"值得注意的是,Brockman也对重返OpenAI持开放态度。...PC版:https://www.cnbeta.com.tw/articles/soft/1398839.htm手机版:https://m.cnbeta.com.tw/view/1398839.htm

封面图片

OpenAI 推迟发布 ChatGPT 的语音助手功能

OpenAI推迟发布ChatGPT的语音助手功能OpenAI推迟发布备受期待的ChatGPT语音助手功能,以确保它能够安全有效地处理来自数百万用户的请求。该公司在5月份的产品发布会上为GPT-4o推出了语音选项。OpenAI表示,它原本打算在6月底向一小部分付费ChatGPTplus用户推出语音功能,但后来认为还需要一个月的时间才能“达到我们的标准”。“我们正在提高该模型检测和拒绝某些内容的能力,”该公司周二表示。此举意味着OpenAI可能遭遇挫折,该公司正努力在日益激烈的人工智能竞争中保持领先地位。

封面图片

OpenAI推出ChatGPT-4:可同时解析文本和图像,支持微软新款必应

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人