-超多方言ASR:支持30多种方言的语音识别模型,打破单一模型方言限制,提供多方言语音数据训练的开源版本,适用于多方言语音识别任

None

相关推荐

封面图片

中国电信发布星辰超多方言语音识别大模型 能同时识别30多种方言

中国电信发布星辰超多方言语音识别大模型能同时识别30多种方言据介绍,研发团队构建了一个超过30种方言、30万小时以上的高质量方言数据库。该系统不仅大大降低了推理时的语音传输比特率,而且让沟通更自然流畅,解决了老年人及“老少边穷”地区信息服务无法触达的问题。值得一提的是,中电信人工智能科技有限公司总经理何忠江表示,语音大模型的算法代码和训练代码将面向社会全部开源开放据报道,目前,星辰语音大模型已在福建、江西、广西、北京、内蒙古等地的中国电信10000智能客服试点应用。接入星辰大模型以后,智能客服秒懂30种方言,实现日均处理约200万通电话。另外,星辰语音大模型还落地多地市的12345平台。...PC版:https://www.cnbeta.com.tw/articles/soft/1432341.htm手机版:https://m.cnbeta.com.tw/view/1432341.htm

封面图片

#语音识别#ASR#AI#开源#webInsanelyFastWhisper基于WhisperLargev3模型的语音转文字工具

封面图片

淘宝上线方言语音搜功能:支持识别东北话、河南话等

淘宝上线方言语音搜功能:支持识别东北话、河南话等对于大多中老年人群来说,日常使用App时语音一般是常用的交流方式,包括语音输入法、语音搜索等等。今日,@万能的淘宝官微宣布淘宝上线方言语音搜功能,能够听的懂方言,只要会说天津话、东北话、山东话、河南话、河北话,打开淘宝,点击语音搜小话筒,动动嘴的功夫就可以轻松购物。淘宝这一功能对于说惯了方言的老人们,可有效解决他们网购过程中的商品搜索阻碍。经实测,在淘宝搜索页面点击话筒图标后,说出东北特色食物—“大碴子粥”后,即可搜出大碴子粥(玉米粒)相关商品。有业内人士表示,淘宝增加方言语音搜索是技术上的创新,也是人机交互的进步,淘宝“入乡随俗”,拥抱银发族。此前,淘宝还上线了拥有更大字体、更简单的操作方式的“长辈模式”,以及拍药瓶买药功能。据了解,淘宝长辈模式目前的字体放大系数是1.375,阿里表示,这是在页面适配范围内能够做到的最大值。同时还将语音输入按钮设在了首页最显眼的位置。PC版:https://www.cnbeta.com/articles/soft/1301953.htm手机版:https://m.cnbeta.com/view/1301953.htm

封面图片

Runtime Speech Recognizer:适用于虚幻引擎(Unreal Engine)的跨平台、实时、离线语音识别插件

:适用于虚幻引擎(UnrealEngine)的跨平台、实时、离线语音识别插件,基于OpenAI的Whisper语音识别引擎。主要特征识别速度快提供纯英文和多语言模型,多语言支持100种语言提供不同型号大小(从75Mb到2.9Gb)在编辑器中自动下载语言模型任选将已识别的语音翻译成英语可定制的属性在设置中轻松选择模型尺寸和语言没有静态库或外部依赖项跨平台兼容性

封面图片

:将文本转换为音素及其持续时间的GPT模型,适用于输入语音合成器

封面图片

#变声器#声音优化师含精语音包,超多丰富语音包,更有多种变声功能,适用于聊天、游戏、语音通话等场景!开黑专属

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人