【Meta推出虚拟语音处理基础设施XLS-R体验版,解决元宇宙多语言问题】

【Meta推出虚拟语音处理基础设施XLS-R体验版,解决元宇宙多语言问题】 11月25日消息,Meta已推出AI语言处理模型XLS-R网页体验版,最高能辨识128种语言,旨在解决元宇宙中听不懂外语问题。不过,该体验版目前存在一定缺陷,仅支持将22种语言翻译为16种语言,但优势在于能将语音拆成拆成25毫秒的基本单元来分析并利用上下文转换语音内容提升辨识准确度。Meta表示,虽然元宇宙离我们仍然有一段距离,但XLS-R等技术可以作为Meta虚拟世界的基础建设之一。

相关推荐

封面图片

ℹMeta 宣布要做一个 AI 通用语音翻译器,为自家元宇宙增益#

ℹMeta 宣布要做一个 AI 通用语音翻译器,为自家元宇宙增益# Meta 表示,尽管像是英语、西班牙语、中文等式我们经常听到的常用语言,但世界上有大约 20% 的人口并不在这些语系涵盖范围内。大多数情况...

封面图片

Meta推出新AI模型 可翻译近百种语言

Meta推出新AI模型 可翻译近百种语言 Facebook的母公司Meta Platforms推出一款人工智能模型,能够翻译和转录数十种语言的语音,是实现跨语言实时交流工具的潜在基础。 路透社报道,Meta星期二在一篇博客文章中表示,其SeamlessM4T模型可以支持近100种语言的文本和语音翻译,以及35种语言的语音到语音翻译。 Meta总裁扎克伯格说,他设想这样的工具能够在元宇宙中促进来自全球各地用户之间的互动。 博客文章中说,Meta将这个模型提供给公众用于非商业用途。 Meta今年推出了一系列的AI模型,其中大部分是免费的。扎克伯格称,开放的AI生态系统对Meta更有利,因为公司通过有效的众包方式为其社交平台创建面向消费者的工具,比对模型的访问收费,获益更多。 对于SeamlessM4T模型,Meta的研究人员在一篇研究论文中表示,他们从约400万小时的“原始音频”中收集了音频训练数据。这些音频源自公开可用的网络数据库,但未具体指明是哪个库。 研究论文说,文本数据来自于去年创建的数据集,这些数据集从维基百科和相关网站中提取内容。

封面图片

Meta前天推出了 Voicebox,一个全能语音生成模型,这是一个支持六种语言和多种语音处理功能的模型,功能包括

Meta前天推出了 Voicebox,一个全能语音生成模型,这是一个支持六种语言和多种语音处理功能的模型,功能包括 基于上下文的文本转语音合成 跨语言风格转换 跨语言风格转换 多样化的语音采样 详细的功能介绍和原理见评 ||

封面图片

【Meta正在探索用于元宇宙的虚拟货币:扎克币】

【Meta正在探索用于元宇宙的虚拟货币:扎克币】 4月7日消息,Meta已经制定了在其应用中引入虚拟货币、代币和贷款服务的计划。据几名知情人士透露,Facebook的金融部门Meta financial Technologies一直在探索为该公司创造一种虚拟货币,内部称为“扎克币”。Meta倾向于引入应用内代币,由该公司集中控制,类似于游戏应用中使用的代币。该公司最近试图寻找其他收入来源,并在该平台上支持电子商务,深入研究加密货币和区块链技术。

封面图片

Meta 推出 SeamlessM4T,一种用于语音和文本翻译的多模式 AI 模型。

Meta 推出 SeamlessM4T,一种用于语音和文本翻译的多模式 AI 模型。 Meta周二发布了 ,这是一个新的多模式和多语言 AI ​​翻译模型,可以让说不同语言的人更有效地进行交流。 M4T 可以进行多达 100 种语言的语音到文本、文本到语音、语音到语音、文本到文本翻译和语音识别。 SeamlessM4T将使用研究许可证公开发布,以便研究人员和开发人员在此基础上开展工作。 Meta还将公布 SeamlessAlign 的元数据,这是迄今为止最大的开放多模式翻译数据集,挖掘的语音和文本对齐总计达 270,000 小时。 随着时间的推移,Meta将把这些翻译和转录方面的 AI 进展整合到Facebook、Instagram、WhatsApp、Messenger和Threads中。 、

封面图片

128k上下文+多语言+工具:Cohere开放企业级应用大模型

128k上下文+多语言+工具:Cohere开放企业级应用大模型 Cohere推出Command R+模型,一个为应对企业级工作负载而构建的最强大、最具可扩展性的大型语言模型(LLM)。 - Command R+首先在Microsoft Azure上推出,旨在加速企业AI的采用。它加入了Cohere的R系列LLM,专注于在高效率和强准确性之间取得平衡,使企业能从概念验证走向生产。 - Command R+具有128k token的上下文窗口,旨在提供同类最佳的性能,包括: - 先进的检索增强生成(RAG)和引用,以减少幻觉 - 支持10种关键语言的多语言覆盖,以支持全球业务运营 - 工具使用,以实现复杂业务流程的自动化 - Command R+在各方面都优于Command R,在类似模型的基准测试中表现出色。 - 开发人员和企业可以从今天开始在Azure上访问Cohere的最新模型,很快也将在Oracle云基础设施(OCI)以及未来几周内的其他云平台上提供。Command R+也将立即在Cohere的托管API上提供。 - Atomicwork等企业客户可以利用Command R+来改善数字工作场所体验,加速企业生产力。 思考: - Cohere推出Command R+,进一步丰富了其企业级LLM产品线,展现了其在企业AI市场的雄心和实力。与微软Azure的合作有望加速其企业客户的拓展。 - Command R+在Command R的基础上进行了全面升级,128k token的上下文窗口、多语言支持、工具使用等特性使其能够胜任更加复杂多样的企业应用场景。这表明Cohere对企业需求有着深刻洞察。 - RAG和引用功能有助于提高模型输出的可靠性,减少幻觉,这对于企业级应用至关重要。可以看出Cohere在兼顾性能的同时,也非常重视模型的可控性。 - 与微软、甲骨文等云计算巨头合作,使Command R+能够在多个主流云平台上快速部署,降低了企业的采用门槛。这种开放的生态策略有利于加速其市场渗透。 - Atomicwork等企业客户的支持表明Command R+具有显著的商业价值。将LLM与企业数字化转型相结合,有望催生更多创新性的应用。 - Command R+的推出标志着Cohere在企业级AI市场的发力,其强大的性能和完善的生态有望帮助其在竞争中占据优势地位。不过,企业AI的落地仍面临数据安全、伦理合规等诸多挑战,Cohere还需要在这些方面持续投入。

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人