中国发布首个支持30种方言混说语音大模型

中国发布首个支持30种方言混说语音大模型 中国运营商发布首个支持30种方言混说语音大模型。 综合中新社和《证券时报》报道,中国电信人工智能研究星期六(5月25日)在第七届数字中国建设峰会上,发布业内首个支持30种方言自由混说的语音识别大模型星辰超多方言语音识别大模型,打破单一模型只能识别特定单一方言的困境。 该大模型可识别理解粤语、上海话、四川话、温州话等30多种方言,是中国支持最多方言的语音识别大模型。 星辰语音大模型也是业内首个开源的基于离散语音表征的语音识别大模型,通过“从语音到token再到文本”的建模新范式,将推理时语音传输比特率降低数十倍。 目前,星辰语音大模型已在福建、江西、广西、北京、内蒙等地的中国电信万号智能客服试点应用。接入星辰大模型以后,智能客服秒懂30种方言,实现日均处理约200万通电话。 2024年5月26日 10:01 PM

相关推荐

封面图片

中国电信发布星辰超多方言语音识别大模型 能同时识别30多种方言

中国电信发布星辰超多方言语音识别大模型 能同时识别30多种方言 据介绍,研发团队构建了一个超过30种方言、30万小时以上的高质量方言数据库。该系统不仅大大降低了推理时的语音传输比特率,而且让沟通更自然流畅,解决了老年人及“老少边穷”地区信息服务无法触达的问题。值得一提的是,中电信人工智能科技有限公司总经理何忠江表示,语音大模型的算法代码和训练代码将面向社会全部开源开放据报道,目前,星辰语音大模型已在福建、江西、广西、北京、内蒙古等地的中国电信10000智能客服试点应用。接入星辰大模型以后,智能客服秒懂30种方言,实现日均处理约200万通电话。另外,星辰语音大模型还落地多地市的12345平台。 ... PC版: 手机版:

封面图片

内地发布识别30种方言AI大模型 称为传承语言文化注新生命力

内地发布识别30种方言AI大模型 称为传承语言文化注新生命力 内地运营商发布支持30种方言混说的语音识别大模型,被称可为传承语言文化,注入全新生命力。 这项语音识别大模型在福州举行的第7届数字中国建设峰会上发布,可识别多种方言,包括识别理解粤语、上海话、四川话、温州话等30多种方言,被指是内地现时支持最多方言的语音识别大模型。 据报这个语音识别大模型已广泛应用落地,在福建、江西、广西、北京、内蒙古等地的中国电信约万个智能客服试点应用。 2024-05-25 20:41:11

封面图片

中国首个音乐SOTA模型「天工音乐大模型」今日公测

中国首个音乐SOTA模型「天工音乐大模型」今日公测 天工SkyMusic:中国首个音乐AIGC SOTA模型。以6.65分的综合得分超越Suno V3,成为全球AI音乐SOTA模型。 生成的中文人声发音清晰、正宗、无异响,没有出现「百老汇式中文歌」等水土不服的情况。而且,它不仅针对普通话做了优化,粤语、成都话、北京话等方言语种也照顾到了。 它能够通过歌词控制情绪变化,并实现如颤音、歌剧、吟唱等多种歌唱技巧,使生成的音乐作品情感更加丰富且贴合情境。

封面图片

Meta前天推出了 Voicebox,一个全能语音生成模型,这是一个支持六种语言和多种语音处理功能的模型,功能包括

Meta前天推出了 Voicebox,一个全能语音生成模型,这是一个支持六种语言和多种语音处理功能的模型,功能包括 基于上下文的文本转语音合成 跨语言风格转换 跨语言风格转换 多样化的语音采样 详细的功能介绍和原理见评 ||

封面图片

Meta 推出 SeamlessM4T,一种用于语音和文本翻译的多模式 AI 模型。

Meta 推出 SeamlessM4T,一种用于语音和文本翻译的多模式 AI 模型。 Meta周二发布了 ,这是一个新的多模式和多语言 AI ​​翻译模型,可以让说不同语言的人更有效地进行交流。 M4T 可以进行多达 100 种语言的语音到文本、文本到语音、语音到语音、文本到文本翻译和语音识别。 SeamlessM4T将使用研究许可证公开发布,以便研究人员和开发人员在此基础上开展工作。 Meta还将公布 SeamlessAlign 的元数据,这是迄今为止最大的开放多模式翻译数据集,挖掘的语音和文本对齐总计达 270,000 小时。 随着时间的推移,Meta将把这些翻译和转录方面的 AI 进展整合到Facebook、Instagram、WhatsApp、Messenger和Threads中。 、

封面图片

一个视频翻译工具,可将一种语言的翻译为另一种语言和配音的。 语音识别基于 openai-whisper 离线模型、文字翻

一个视频翻译工具,可将一种语言的视频翻译为另一种语言和配音的视频。 语音识别基于 openai-whisper 离线模型、文字翻译使用google翻译接口,文字合成语音使用 Microsoft Edge tts,背景音乐去除使用 Spleeter,无需购买任何商业接口,也无需付费 | #工具

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人