AI识别唇语:Meta 开源第一个视听语言翻译语料库 MuAViC

AI识别唇语:Meta 开源第一个视听语言翻译语料库 MuAViC MuAViC 源数据来自 TED 和 TEDx 超过8000名演讲者的视频,提供了9种语言的1200小时的音频-视觉语料,包括英语、阿拉伯语、德语、希腊语语、西班牙语、法语、意大利语、葡萄牙语和俄语。 MuAViC 支持多种任务,如自动语音识别、唇读、机器翻译和端到端的语音到文本翻译。Meta 的开源模型 AV-HuBERT 经过 MuAViC 训练后,在嘈杂环境中的表现远优于其它领先的翻译模型。

相关推荐

封面图片

【跨语种“AI同传”震撼登场,Meta谷歌连发重大突破,颠覆语音翻译】Meta谷歌接连放出重磅成果!Meta开源无缝交流语音翻译

【跨语种“AI同传”震撼登场,Meta谷歌连发重大突破,颠覆语音翻译】Meta谷歌接连放出重磅成果!Meta开源无缝交流语音翻译模型,谷歌放出无监督语音翻译重大突破Translation 3。 #抽屉IT

封面图片

Meta推出新AI模型 可翻译近百种语言

Meta推出新AI模型 可翻译近百种语言 Facebook的母公司Meta Platforms推出一款人工智能模型,能够翻译和转录数十种语言的语音,是实现跨语言实时交流工具的潜在基础。 路透社报道,Meta星期二在一篇博客文章中表示,其SeamlessM4T模型可以支持近100种语言的文本和语音翻译,以及35种语言的语音到语音翻译。 Meta总裁扎克伯格说,他设想这样的工具能够在元宇宙中促进来自全球各地用户之间的互动。 博客文章中说,Meta将这个模型提供给公众用于非商业用途。 Meta今年推出了一系列的AI模型,其中大部分是免费的。扎克伯格称,开放的AI生态系统对Meta更有利,因为公司通过有效的众包方式为其社交平台创建面向消费者的工具,比对模型的访问收费,获益更多。 对于SeamlessM4T模型,Meta的研究人员在一篇研究论文中表示,他们从约400万小时的“原始音频”中收集了音频训练数据。这些音频源自公开可用的网络数据库,但未具体指明是哪个库。 研究论文说,文本数据来自于去年创建的数据集,这些数据集从维基百科和相关网站中提取内容。

封面图片

Meta 推出 SeamlessM4T,一种用于语音和文本翻译的多模式 AI 模型。

Meta 推出 SeamlessM4T,一种用于语音和文本翻译的多模式 AI 模型。 Meta周二发布了 ,这是一个新的多模式和多语言 AI ​​翻译模型,可以让说不同语言的人更有效地进行交流。 M4T 可以进行多达 100 种语言的语音到文本、文本到语音、语音到语音、文本到文本翻译和语音识别。 SeamlessM4T将使用研究许可证公开发布,以便研究人员和开发人员在此基础上开展工作。 Meta还将公布 SeamlessAlign 的元数据,这是迄今为止最大的开放多模式翻译数据集,挖掘的语音和文本对齐总计达 270,000 小时。 随着时间的推移,Meta将把这些翻译和转录方面的 AI 进展整合到Facebook、Instagram、WhatsApp、Messenger和Threads中。 、

封面图片

华为智驾新专利公布:可识别唇语并报警

华为智驾新专利公布:可识别唇语并报警 摘要显示,本申请提供了一种报警方法、装置以及智能驾驶设备。智能驾驶设备中的报警装置根据第一唇部图像信息确定用户的第一唇部特征信息,所述第一唇部图像信息是第一相机获取的。所述报警装置将所述第一唇部特征信息输入到唇语报警模型中,得到第一报警信息。所述报警装置根据所述第一报警信息进行报警。通过上述方法,当用户受到车辆以外的人和物的威胁时,车辆能够识别用户的唇语并进行报警,从而保护用户的人身安全。 ... PC版: 手机版:

封面图片

Meta 真的把语言研究透了

Meta 真的把语言研究透了 今天推出 Massively Multilingual Speech - 为 1,100 多种语言推出语音转文本、文本转语音等功能,语言转文本的错误率只有 Whisper 的一半 - 为 4000 多种语言训练的语言识别模型,仅有6.1%的错误率 - 这项研究的关键是使用了一个巧妙的宗教语言数据集: 1/3

封面图片

ℹMeta 与 Microsoft 高通合推次世代 AI 大型语言模型 Llama 2,主打免费开源进军商用市场#

ℹMeta 与 Microsoft 高通合推次世代 AI 大型语言模型 Llama 2,主打免费开源进军商用市场# Meta / Meta Platforms 借由发表次世代 AI 大型语言模型 Llama 2 的机会,也宣布了这个主打免费开源的商用 L...

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人