商业版ChatGPT单价骤减9成 推出语音转文字API

商业版ChatGPT单价骤减9成推出语音转文字API公司介绍称,这次提供的API,基于ChatGPT同款的GPT3.5模型。更为重要的是,在去年12月后,公司已经成功将ChatGPT的成本压低了90%。因此,这款名为“gpt-3.5-turbo”的模型,定价为0.002美元/每1000tokens。根据OpenAI官网的解释,token可以理解为一个一个非结构化的单词,而1000个token大概对应750个词。这个价格也要比目前的GPT3.5模型便宜90%。(来源:OpenAI)截至发稿,已经有多款商业应用成为ChatGPTAPI的早期用户。图片和短视频社交平台Snap在本周推出了名为“MyAI”的可定制化聊天机器人,供付费订阅用户使用。而拥有6000万学生用户的Quizlet在线学习平台,则提供能出题考验学生的家教机器人。许多中国零售业者出海卖货会用到的Shopify平台,也已经上线了聊天机器人导购。短短几个月内,ChatGPT迅速在全球软件生态中觅得自己的位置。(来源:Shopify)除了聊天机器人外,OpenAI也在周三拿出了商业化的语音转文字方案。公司最早在去年9月推出Whisper语音转文字模型,而今天则正式拿出了API接口供商业伙伴付费接入,定价为每分钟0.006美元。根据公司介绍,WhisperAPI支持对语音文件进行转录和翻译,并支持包括英语、中文、阿拉伯语、日语、德语、西班牙语等几十种语言。不过值得注意的是,OpenAI的产品说明文档中也显示,在业界常用的FLEURS数据集测试中,Whisperlarge-v2模型在识别英语、意大利语、德语时的单词错误率都能控制在5%以下,但识别中文的错误率达到14.7%,潜在的原因可能是训练数据中,中文语料的不足。(来源:OpenAI)OpenAI也警告称,由于人工智能会对语音进行“下一个词”的主动预测,所以生成的文本中可能会包含说话者实际上没说过的词。...PC版:https://www.cnbeta.com.tw/articles/soft/1347217.htm手机版:https://m.cnbeta.com.tw/view/1347217.htm

相关推荐

封面图片

商业版ChatGPT单价骤减9成,推出语音转文字API#抽屉IT

封面图片

OpenAI 开放 ChatGPT 与 Whisper 的 API

OpenAI开放ChatGPT与Whisper的API开发人员现可将它们集成到自己的应用程序和产品中。自去年12月以来,OpenAI已将ChatGPT的成本降低了90%,现将这些节省的资金让利给API用户。ChatGPTAPI每1000tokens的价格为$0.002,比现有的GPT-3.5模型便宜10倍。可以起草邮件或文章、编写Python代码、回答有关某组文件的问题、创建聊天机器人、为软件提供自然语言界面、一系列科目的导师、翻译语言、角色扮演等等。WhisperAPI可将98种语言(包括中文)的音频转换成文本和翻译成英文,将一小时视频/音频转换成字幕的价格为$0.36,该语音转文本模型也在2022年9月开源。投稿:@ZaiHuabot频道:@TestFlightCN

封面图片

OpenAI 低价倾销 ChatGPT API

OpenAI低价倾销ChatGPTAPIOpenAI向开发者释放了它的ChatGPT和Whisper模型,他们现在可以通过API调用将这个聊天机器人互动和语音到文本转换整合到自己的应用程序中。新的ChatGPTAPI将使用与ChatGPT相同的人工智能模型,其API的价格为每1000个字元(约750个单词)0.2美分。OpenAI称这比以前的GPT模型便宜10倍。Whisper是去年9月发布的一个自动语音识别系统,它能够将英语口语转化为文本。Whisper的价格为0.6美分/分钟。来源,来自:雷锋频道:@kejiqu群组:@kejiquchat投稿:@kejiqubot

封面图片

ChatGPT官方API发布:输出100万词只要2.7美金 成本砍掉90%

ChatGPT官方API发布:输出100万词只要2.7美金成本砍掉90%这将大大降低开发人员将ChatGPT集成到自家应用和服务的门槛,构建属于自己的AI聊天机器人。而且OpenAI将ChatGPT从去年12月至今的成本砍掉了90%,令此前许多靠开发私有ChatGPTAPI接口赚差价的中间商们再无用武之地。ChatGPT官方API基于GPT-3.5-turbo模型,是GPT-3.5系列中最快速、最便宜、最灵活的模型。开发者可以通过OpenAIPlayground和OpenAICodex来使用和测试ChatGPTOpenAI。此前一些公司已经率先接入ChatGPTAPI,包括生鲜电商平台Instacart、跨境电商平台Shopify、照片分享应用Snap、单词背诵应用Quizlet等,用于提高客户服务、营销、教育等效率及体验。OpenAI还在不断改进其ChatGPT模型,并希望将增强功能也提供给开发人员。使用该gpt-3.5-turbo模型的开发人员将始终获得OpenAI发布的稳定模型,同时仍然可以灵活地选择特定模型版本。例如,今天发布的gpt-3.5-turbo-0301,它至少会在6月1日之前推出特定版本,OpenAI会将gpt-3.5-turbo在4月更新到新的稳定版本。此外,OpenAI还推出了基于large-v2模型的Whisper官方API。Whisper是OpenAI去年9月发布的开源自动语音识别(ASR)模型。开发者可用该功能来转录或翻译音频,费用为每分钟0.006美元。01.ChatGPT官方API来了!输出100万个Tokens只要2美金OpenAI官方宣布,其发布的ChatGPT模型系列与ChatGPT产品中使用的模型相同,对于许多非聊天应用场景,这仍然是他们的最佳模型。一些早期的开发人员,从“text-davinci-003”模型迁移至“gpt-3.5-turbo”只需根据提示进行少量调整。一般情况下,GPT模型数据使用的是电子邮件文本、Twitter信息、博客、新闻等信息中的非结构化文本,这些文本在模型中表现为一系列的“Tokens”,tokens可以被看作将文本切分成的若干个片段,1000个tokens大约是750个单词。而ChatGPT则改为使用一系列消息和元数据的新格式。在底层,输入仍然以tokens序列呈现给模型,模型使用的原始格式就变为一种聊天标记语言ChatML的新格式。OpenAI创建了一个新端点来与ChatGPT模型进行交互。值得注意的是,虽然0.002美元1000个tokens的价格并不贵,但1000个tokens在实际使用中数量并不算多,发送一段文本供API响应就可能会花费多个tokens。例如一个简单的字符串“ChatGPTisgreat!”,就被编码为六个tokens:“Chat”、“G”、“PT”、“is”、“great”、“!”.OpenAI提供了一种工具来检查解释一串文本需要多少标记,并介绍称一般的经验法则是一个token通常对应于约4个字符。02.为高需用户提供专用实例,性价比更高OpenAI还将为希望控制特定型号版本和系统性能的用户提供专用实例(Dedicatedinstances),也就是希望通过API运行大量数据的开发人员。默认情况下,开发人员是按照需求来付费,并且这些需求会执行在共享的计算基础设施之上。使用专用实例,开发人员将按照时间段支付,分配计算基础设施的费用,而这些基础设施就是专门为这些开发人员保留的。专用实例下,开发人员可以更好地控制使用的模型,包括希望它响应请求需要的时间以及与机器人对话可以持续多长时间等。对于每天运营超过4.5亿tokens的开发人员来说,专用实例可能性价比更高。此外,这一条件下还可以根据硬件性能直接优化开发人员的工作负载,这可以显著降低与共享基础设施相关的成本。03.社交、学习、配送、购物程序均已接入ChatGPTAPI此前已经有几家公司接入ChatGPTAPI来创建聊天界面。照片分享应用Snap,本周推出通过ChatGPTAPI接入的“MyAIforSnapchat+”功能,其提供了一个友好的、可定制的聊天机器人。用户通过手机就可以与它聊天获得建议,并在几秒内为朋友写一个笑话。单词背诵应用Quizlet推出了Q-Chat,可以让学生通过有趣的聊天体验中提供的学习材料,来提出相应问题获得知识。生鲜电商平台Instacart计划在今年晚些时候推出“AskInstacart”,这一功能可以帮助用户在询问食物相关问题时获得一些想法,例如用户可以问“对我的孩子来说,什么是健康的午餐?”跨境电商平台Shopify的新购物助手,将会根据购物者的需求进行个性化推荐,通过扫描数百万种产品来简化应用程序内购物的步骤,以快速找到买家正在寻找的东西。04.语音转文本每分钟仅0.006美元,API数据不用于模型训练除了引人关注的ChatGPTAPI外,OpenAIAI驱动的语音转文本模型也可以通过API接入,该公司正在对其开发人员服务条款进行一些重要更改。开发人员可以使用这一功能来转录或翻译音频,费用为每分钟0.006美元。从技术上讲,Whisper模型是开源的,因此开发人员无需支付任何费用也可以在自己的硬件上运行它。但是,如果在一些特殊情况下,例如开发人员对接入效率的要求较高以及需要在手机等低功率设备上转录。就可以通过OpenAI提供的更强大API。除了开放API外,OpenAI还基于开发人员反馈宣布了一些政策变更:通过API提交的数据不再用于服务改进(包括模型训练),除非相应的公司选择或者统同意加入;为API用户实施默认的30天数据保留政策,并根据用户需求提供更严格的保留选项;通过改进自动监控解锁来删除OpenAI发布前审查;改进开发人员文档;简化其服务条款和使用政策,包括有关数据所有权的条款:用户拥有模型的输入和输出。05.结语:OpenAI为开发者打开AI应用大门此前,一些开发人员已经找到了在自己的应用程序中接入聊天机器人的解决办法,那就是使用OpenAI的常规GPTAPI,但从应用和开发难度来看,都没有达到最佳效果。对于大多人开发人员来说,开发如同ChatGPT这样的自己的聊天机器人模型是完全遥不可及的,但此次官方将ChatGPTAPI正式打开,且其花费的价格并不高,为开发人员构建聊天机器人打开大门。OpenAI的官方博客中也谈道,他们认为人工智能可以为每个人提供难以置信的机会,而实现这一目标的最佳方式就是让每个人都可以利用它进行开发。...PC版:https://www.cnbeta.com.tw/articles/soft/1347275.htm手机版:https://m.cnbeta.com.tw/view/1347275.htm

封面图片

Android上的免登录版ChatGPT已进入测试阶段

Android上的免登录版ChatGPT已进入测试阶段OpenAI传统上要求用户通过创建OpenAI账户或使用Google、苹果或微软账户登录来使用ChatGPT。该公司上个月宣布,用户无需账户即可免费与ChatGPT进行即时对话。OpenAI指出了拥有账户的几个好处,"包括保存和查看聊天记录、分享聊天内容,以及解锁语音对话和自定义指令等附加功能"。不过,无需登录账户,让人们可以更方便快捷地使用ChatGPT,尤其是那些期待OpenAI推出可与Google媲美的专用搜索引擎的人们。OpenAI上个月表示,免登录版本的ChatGPT正在"逐步"推出。现在,该刊物预计,虽然该功能是在Android版本上发现的,但在不久的将来,它将同时适用于Android和iOS。用户可以选择不使用他们的对话来改进ChatGPT和OpenAI模型。不过,无登录版本的聊天机器人不允许用户上传图片,GPT-4o模型提供的这一功能要求用户使用免费或高级账户登录。OpenAI上周在春季更新活动上发布了一系列公告。除了GPT-4o之外,它还展示了新的MacOSChatGPT应用程序和人工智能语音。不过,OpenAI决定暂时停止使用其中一个听起来很像斯嘉丽-约翰逊(ScarlettJohansson)的AI语音。ChatGPT现在支持GoogleDrive和OneDrive等云存储服务,并提供用于数据分析的互动工具。聊天机器人还可以从Reddit帖子中提取内容,这是两家公司合作的一部分。...PC版:https://www.cnbeta.com.tw/articles/soft/1431666.htm手机版:https://m.cnbeta.com.tw/view/1431666.htm

封面图片

ChatGPT推出语音和图像功能 现在可以用不同形式的命令向AI提问

ChatGPT推出语音和图像功能现在可以用不同形式的命令向AI提问据OpenAI称,新功能将在未来两周内向付费使用ChatGPT的用户推出,"不久之后"其他用户也将获得新功能。语音聊天部分让人非常熟悉:你点击一个按钮并说出你的问题,ChatGPT会将其转换为文本并将其输入大型语言模型,然后得到答案,再将其转换为语音,并大声说出答案。这种感觉就像与Alexa或Google助手交谈一样,只是OpenAI希望,由于底层技术的改进,答案会更好。大多数虚拟助手似乎都在依靠LLM进行改造,而OpenAI则走在了前面。OpenAI出色的Whisper模型完成了大量的语音转文本工作,而且该公司正在推出一种新的文本转语音模型,据称它可以"通过文本和几秒钟的语音样本生成类似人类的音频"。你可以从五个选项中选择ChatGPT的声音,但OpenAI似乎认为该模型的潜力远不止于此。例如,OpenAI正在与Spotify合作,将播客翻译成其他语言,同时保持播客的声音。合成语音有很多有趣的用途,OpenAI可以成为该行业的重要组成部分。但事实上,只需几秒钟的音频就能建立一个有能力的合成语音,这也为各种有问题的用例打开了大门。该公司在一篇宣布新功能的博文中说:"这些功能也带来了新的风险,比如恶意行为者有可能冒充公众人物或实施欺诈。正是出于这个原因,OpenAI才没有广泛使用这种模式:它将受到更严格的控制,并仅限于特定的使用案例和合作关系。"与此同时,图片搜索有点像GoogleLens。你只需拍下感兴趣的照片,ChatGPT就会找出你的问题所在,并做出相应的回应。你还可以使用该应用的绘图工具来帮助清楚地表达你的疑问,或者根据图片说出或输入问题。这就是ChatGPT来来回回的特性所带来的帮助:你可以一边提示机器人,一边完善答案,而不是先搜索,得到错误答案后再搜索。(这与Google在多模态搜索方面的做法很相似)。显然,图像搜索也有其潜在的问题。其一是当你向聊天机器人提示一个人时,可能会发生什么:OpenAI表示,出于准确性和隐私方面的考虑,它有意限制了ChatGPT"分析和直接陈述人的能力"。这意味着人工智能最科幻的愿景之一--看着一个人说:"那是谁?-这种能力不会很快实现。这也许是件好事。在ChatGPT首次发布近一年后,OpenAI似乎仍在努力探索如何为其机器人提供更多特性和功能,同时又不带来新的问题和弊端。在这些版本中,该公司试图通过故意限制其新机型的功能来实现这一目标。但这种方法不会永远奏效。随着越来越多的人使用语音控制和图像搜索,随着ChatGPT逐步成为一个真正多模式、实用的虚拟助手,要想继续保持护栏就会越来越难。...PC版:https://www.cnbeta.com.tw/articles/soft/1386261.htm手机版:https://m.cnbeta.com.tw/view/1386261.htm

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人