德国非营利组织LAION计划推出完全开放的语音助手BUD-E

德国非营利组织LAION计划推出完全开放的语音助手BUD-E而BUD-E的目标就是可以充分调用大语言模型的技术,让语音助手可以使用更加自然的语音模式和人类用户进行对话。LAION表示,他们将确保BUD-E的每个组件最终都可以与应用程序和服务免许可集成,甚至是商业集成,而其他开放式助手工作则不一定如此。BUD-E(“BuddyforUnderstandingandDigitalEmpathy”的递归简写)项目将由LAION与图宾根埃利斯研究所、技术咨询公司Collabora和图宾根人工智能中心合作。在一篇博文中,LAION团队列出了他们希望在未来几个月内完成的目标,主要工作包括在BUD-E中构建“情感智能”,并确保它能够同时处理涉及多个发言者的对话。...PC版:https://www.cnbeta.com.tw/articles/soft/1419163.htm手机版:https://m.cnbeta.com.tw/view/1419163.htm

相关推荐

封面图片

ChatGPT该给语音助手们补补“智商”了

ChatGPT该给语音助手们补补“智商”了微软CEO萨蒂亚·纳德拉最近在接受英国《金融时报》采访时表示,苹果的Siri、亚马逊的Alexa,微软自家的Cortana(中文名:小娜)以及公认拔尖的GoogleAssistant,这些语音助手有一个算一个:都笨得跟石头一样。纳德拉和Cortana,图/微软2014年4月,纳德拉刚刚上任微软CEO两个月后的微软Build开发者大会上,微软全球副总裁乔北峰正式推出了Cortana。在最初的几年,Cortana表现了不俗的智能,也受到包括纳德拉在内微软高层的集体认可,纳德拉在2016年还称赞Cortana的智能,并说“机器人是新应用”。但Cortana的智能(横向比较)和市场份额越来越糟糕,到2021年微软就正式宣布停止支持iOS和Android上的Cortana应用,仅保留对Windows平台的支持。更重要的是,OpenAI带着ChatGPT来了,微软直接拿到了AI时代目前为止最好的一张船票。与此同时,语音助手在过去几年基本陷入了停滞,Siri的联合创始人AdamCheyer也承认,ChatGPT理解复杂信息的能力让现有的语音助手看起来很蠢。但换句话说,如果能在语音助手上实现类似ChatGPT理解复杂信息的能力,Siri和小爱同学是不是就能重获新生?至少很多人已经开始尝试了。个人开发者的尝试ChatGPT出现后不久,互联网上其实就有了一大堆的新想法,声量最大的一个是改变“搜索”,如今已经成为了搜索引擎巨头的共识,微软必应已经在测试,Google和百度也提前进行了预告。而另一方面,也有不少人在惊叹于ChatGPT的自然语言沟通能力之余,期望会推出语音助手版本的ChatGPT,替代掉目前不堪一“谈”的语音助手。在今年又一轮爆发之后,尽管我们还是没看到OpenAI或者微软推出对应的语音助手版,但已经有开发者进行了大量的尝试。xiaogpt,图/GitHub在全球最大的代码托管平台Github上,就有开发者尝试将ChatGPT接入小爱同学,Star数已经达到了1.3k。据项目介绍,只要有ChatGPT的账号、小爱音箱、正常连接ChatGPT的网络以及python3.8+,人人都可以在小爱音箱上使用“ChatGPT版小爱同学”。原理上很简单,唤起小爱同学后,以“帮我”开头询问的问题会自动以文本形式发送一份给ChatGPT,同时会屏蔽小爱同学原本的回答,替换成“正在问GPT,请耐心等待”,而ChatGPT生成的文本则会被小爱同学通过TTS(语音合成技术)进行语音回答。从开发者的显示,整个过程足够流畅,实际回答也远超小爱同学原本的“智力”。(具备条件可搜索GitHub项目“xiaogpt”)演示,图/YouTube不仅是小爱同学,另一位更为大众调侃的“智障”语音助手——Siri,实际上更早就被开发者尝试接入ChatGPT。围绕Siri其实有不少尝试,其中国内开发者@Yue-Yang最近就以“快捷指令”形式连接了Siri和ChatGPT,让Siri变成真正的AI聊天机器人。在GitHub或者“小众软件”上你都能找到对应的快捷指令——智能聊天,不过使用条件是需要申请OpenAI的付费API。“ChatGPTSiri”在原理上与“xiaogpt”类似,利用OpenAI的API(应用程序接口)和iOS的特性,先将语音指令转换为文本再传递给ChatGPT,收到回答后再让Siri“读”出来。在B站上,通过搜索“ChatGPTSiri”可以查看对应的。ChatGPTSiri,图/GitHub当然,以上两个项目都是个人开发者的尝试,也包括其他类似的项目,不管是使用体验还是上手门槛,都并不适合普通用户。考虑到语音助手的技术、产品和生态,大公司的入场很可能降低门槛、提高整体的使用体验。问题在于意愿和能力,很多公司其实也看到了站在ChatGPT的“肩膀”上重新打造语音助手的可能性,但在全球范围内,真正同时手握AI能力和语音助手背后生态的公司总共也就那几家。巨头的入场,不远了与搜索一样,ChatGPT不可能直接取代现有的语音助手。一方面语音交互的优势在于直接、易上手,很多任务通过触控、文字输入等方式不仅繁琐、更耗时间,同时对于老人、小孩等用户也偏于复杂,自然的语音交互则能比较轻松地实现。另一方面,ChatGPT并不能对现实层面进行直接干预,比如我们用Siri或者小爱同学操控空调、扫地机器人等。ChatGPT,或者说生成式AI更大的价值在于通过强大的自然语言理解和沟通能力,来改善语音助手的使用体验。小爱同学5.0发布现场,图/小米过去我们总抱怨AI太笨,要么答非所问,要么干脆就是“我没有明白”,基本几轮对话就会感到心累,转向对功能性的需求,比如天气、问题查询、智能家居操作等。相反,ChatGPT的对话能力则基本不用担心,尽管可能会有错误信息,但至少不会像Siri和小爱同学那样沟通成本太高。这也是多年的发展停滞之后,语音助手的关键机会所在。2月底,微软在推出支持AI对话的新必应之后,又支持了Android和iOS版本,并且在AI对话中第一次增加了语音对话功能,用户如果使用语音开启对话,新必应也会使用语音回应。不过就现在而言,新必应的语音对话功能还仅限于对话,并不能用来进行一系列操作,比如在手机上唤起某个系统或应用的功能,也不支持设置为默认的语音助手。语音功能加入,图/微软此外,微软自家的Windows平台也还未支持,目前为止尚未流出Cortana或其他新语音助手加入类ChatGPT能力的消息。而更早些时候,小度官方在2月初宣布,AI语音助手小度将在未来融合百度文心一言的全面能力,同时在此基础上还将打造针对智能设备场景的人工智能模型“小度灵机”并应用到小度全系产品。而据小度官方数据,搭载小度的智能设备已经进入了4000万户家庭。当然,按照百度此前的规划,文心一言要在本月才上线测试,距离小度全面接入文心一言的显然还需要一段时间。另一方面,Google也早早看到了这一点。2021年的I/O大会上,Google就首次宣布将LAMDA大语言模型的对话能力整合入GoolgleAssistant、搜索和Workspace。今年2月,Google推出了类ChatGPT的聊天机器人Bard之后,接入GoogleAssistant似乎也是题中应有之义,包括9TO5Google、《连线》杂志也认为Google应该这么做。就像人人都知道语音助手的“蠢”,所有人也看到了ChatGPT让语音助手们至少在理解人类语言和对话上“变聪明”的很大可能。“贾维斯,有时在你学会走之前得先跑起来”,图/《钢铁侠》过去我们都畅想过,有一个数字语音助手可以在日常生活中帮我们解决各种需求,就像《钢铁侠》里的贾维斯,现实是Siri和小爱同学们距离听懂人类的话还差很远,充斥着各种“不明白”“听不懂”。的确,现实世界的技术还赶不上科幻世界的想象很正常,但ChatGPT背后强大的对话语言能力,无疑可以让语音助手们能够更流畅地与我们对话,让我们更感觉在对话的是一个“智商在线”的AI助手,而非对牛弹琴。而对于智能音箱和智能家居厂商,这也意味着更高的用户粘性和使用率。更或许,当AI越来越聪明并理解人类,智能家居乃至物联网的未来也会随之发生巨变。...PC版:https://www.cnbeta.com.tw/articles/soft/1348653.htm手机版:https://m.cnbeta.com.tw/view/1348653.htm

封面图片

TomTom 与微软合作打造人工智能车载对话助手

TomTom与微软合作打造人工智能车载对话助手荷兰地图制作公司TomTom周二表示,该公司已与微软合作,为汽车开发一款人工智能(AI)助手。该公司表示,该助手将允许用户“与他们的车辆自然对话”,并实现与信息娱乐、位置搜索和车辆指挥系统的语音交互。微软AzureOpenAI服务允许企业利用ChatGPT制造商OpenAI的大型语言模型(LLM)。据悉,语音助手可以集成到其他汽车信息娱乐系统中,也可以内置到TomTom的数字驾驶舱(DigitalCockpit)中,这是一个开放的模块化车载信息娱乐平台。

封面图片

OpenAI:推迟发布语音助手以保更佳处理用户要求

OpenAI:推迟发布语音助手以保更佳处理用户要求美国开放人工智能研究中心(OpenAI)25日宣布,推迟发布ChatGPT语音助手功能,以确保其能安全有效地处理海量用户要求。OpenAI当天发表声明说,原计划6月底向ChatGPT付费用户小范围开放语音助手功能,但现在认定仍需一个月才能“达到发布门槛”。这家公司在声明中说:“我们正提升大模型的能力,以甄别并拒绝某些内容。我们还在努力改善用户体验,将基础设施扩展至数以百万计用户规模的同时,保持实时响应。”美国彭博新闻社评论,OpenAI努力想在人工智能领域日益拥挤的赛道保持领先,此次推迟发布表明这家公司可能遭遇挫折。OpenAI说,计划今年秋季向全部付费用户发布语音助手功能,同时正致力于发布于5月展示的视频等功能,将在今后告知用户相关功能发布的时间。OpenAI5月展示了最新多模态大模型GPT-4o,语音、文本和音视频交互功能都有所加强。(新华社)

封面图片

ChatGPT很快将支持设置为Android默认语音助手 替代谷歌的谷歌助理

ChatGPT很快将支持设置为Android默认语音助手替代谷歌的谷歌助理据AndroidAuthority发布的消息,对ChatGPT安卓版的拆解发现OPENAI已经计划为ChatGPT提供新功能,可以设置为Android平台的默认语音助手,替代系统默认的GoogleAssistant。OPENAI在上个月推出的ChatGPT1.2023.352版添加了一个名为com.openai.voice.assistant.AssistantActivity的新控件,该控件目前是处于禁用状态的,但从测试来看大概率这就是要支持设置为系统默认的语音助手,这样用户并不需要启动ChatGPT,只需要语音激活ChatGPT后即可直接对话,对话界面覆盖其他应用,交互完成后界面推出。对安卓用户来说这是一个极好的消息,因为后续使用ChatGPT更方便了,不过iOS目前并不能修改默认的语音助手,所以无法获得此类功能。来源,频道:@kejiqu群组:@kejiquchat

封面图片

三星在AIGC赛道上再发力 计划升级核心语音助手Bixby

三星在AIGC赛道上再发力计划升级核心语音助手BixbyBixby遍布该公司生产的多种电子产品,从智能手机、智能手表到家用电器。该公司将其视为用户控制家用设备的关键工具。但语音助手通常不太“健谈”,它只能够依据用户提出问题来给出答案。而近年,随着OpenAI的ChatGPT及其他竞争对手出现之后,聊天机器人现在更加先进,它们基于生成式人工智能的技术,能够处理更复杂的查询,并以文本、图片甚至视频的形式生成回应。注入新技术与许多其他智能手机制造商一样,三星正寻求为其设备注入更先进的人工智能功能。Bixby就是一个很好的路径。三星移动业务执行副总裁Won-joonChoi在接受采访时表示,“Bixby一直是三星的关键语音助手,不仅适用于移动设备,也适用于三星生态系统中存在的电视和数字设备。因此,到目前为止,它一直是核心的语音助手。”Choi还指出,“随着生成式人工智能和LLM(大型语言模型)技术的出现,我们必须重新定义Bixby这一角色,使Bixby能够配备生成式人工智能,并在未来变得更加智能…这将使对话更加自然。”Won-joonChoi没有给出Bixby将会何时支持生成式人工智能功能的具体时间,不过他表示,三星正在“努力”实现这些功能。此前,三星电子推出了最新的S24系列智能手机,与之一并推出的还有GalaxyAI的新功能。作为首款人工智能手机,其中增加了一些新功能,例如用户可以在屏幕上圈出某些内容,然后在谷歌上搜索,而无需切换应用程序。在此之际,投资者还在密切关注苹果在生成式人工智能方面会带来什么。苹果公司宣布将于6月举行年度开发者大会WWDC,届时该公司有望在其产品中介绍一些人工智能功能。...PC版:https://www.cnbeta.com.tw/articles/soft/1425755.htm手机版:https://m.cnbeta.com.tw/view/1425755.htm

封面图片

ChatGPT 的语音功能现向所有免费用户开放

ChatGPT的语音功能现向所有免费用户开放ChatGPT的语音功能现已免费向所有用户开放。在X上的一篇推文中,OpenAI宣布用户现在可以点击耳机图标,在移动应用中使用语言与ChatGPT对话,并获得语音回应今年9月,OpenAI首次推出了用语音和图像提示ChatGPT的功能,但该功能只对付费用户开放。在推文示例中,OpenAI还对近期发生的事情开了一个笑话,有人问ChatGPT:“团队度过了一个漫长的夜晚,我们都饿了。我应该为778人点多少份16英寸的披萨?”这个人数与OpenAI员工人数大致一样,其中大部分人已签署公开信,要求解散董事会,不然就辞职。——、(提示:)

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人