字节跳动语音合成seed-tts评估工具:用于评估零样本语音生成模型的跨域客观测试集,通过英语和普通话公共语料库的样本来衡量模型

字节跳动语音合成seed-tts评估工具:用于评估零样本语音生成模型的跨域客观测试集,通过英语和普通话公共语料库的样本来衡量模型性能,包含英语和普通话的公共语料库样本,采用词错误率和说话人相似度作为客观评价指标 | #工具

相关推荐

封面图片

AI识别唇语:Meta 开源第一个视听语言翻译语料库 MuAViC

AI识别唇语:Meta 开源第一个视听语言翻译语料库 MuAViC MuAViC 源数据来自 TED 和 TEDx 超过8000名演讲者的视频,提供了9种语言的1200小时的音频-视觉语料,包括英语、阿拉伯语、德语、希腊语语、西班牙语、法语、意大利语、葡萄牙语和俄语。 MuAViC 支持多种任务,如自动语音识别、唇读、机器翻译和端到端的语音到文本翻译。Meta 的开源模型 AV-HuBERT 经过 MuAViC 训练后,在嘈杂环境中的表现远优于其它领先的翻译模型。

封面图片

搭建算力、语料公共服务平台,上海为大模型基础底座赋能

搭建算力、语料公共服务平台,上海为大模型基础底座赋能 “到2025年底,建成世界级人工智能产业生态;力争全市智能算力规模突破100EFLOPS;形成50个左右具有显著成效的行业开放语料库示范应用成果;建设35个大模型创新加速孵化器,建成一批上下游协同的赋能中心和垂直模型训练场。”2024年12月,上海发布《关于人工智能“模塑申城”的实施方案》(以下简称《实施方案》),在方案中提出了一系列有关人…… - 电报频道 - #娟姐新闻: @juanjienews

封面图片

书生·万卷1.0为书生·万卷多模态语料库的首个开源版本,包含文本数据集、图文数据集、视频数据集三部分,数据总体超过2TB。

书生·万卷1.0为书生·万卷多模态语料库的首个开源版本,包含文本数据集、图文数据集、视频数据集三部分,数据总体超过2TB。 基于大模型数据联盟构建的语料库,上海AI实验室对其中部分数据进行了细粒度清洗、去重以及价值梳理,形成了书生·万卷1.0,具备多元融合、精细处理、价值梳理、数学高效等四大特征。 在多元方面,书生·万卷1.0包含文本、图文、视频等多模态数据,范围覆盖科技、融合、媒体、教育、法律等多个领域,在训练提升模型知识内涵、逻辑推理和泛化推理化能力方面具有显着效果。 在精细化处理方面,书生·万卷1.0经历了甄别语言、正文抽取、格式标准化、基于规则及模型的数据过滤与清洗、多维度重整、数据质量评估等精细化数据处理环节,从而能够更好接地装配后续的模型训练需求。 在价值洞察方面,研究人员在书生·万卷1.0的构建过程中,着眼于内容与中文主流价值观结合的洞察,通过算法与人工评估的方式,提升了语料的纯净度。 在高效建模方面,研究人员在书生·万卷1.0统一格式,并提供了详细的参数字段说明和工具指南,综合考虑了建模性和效率,可快速评估语言、多模态等大模型训练。 目前,书生·万卷1.0已被评估书生·多态、书生·浦语的训练。通过对高质量语料的“消化模型”,书生系列模型在语义理解、知识问答、视觉理解、视觉问答等各类生成式任务表现出了优异的性能。 | #语料库

封面图片

【虎虎生威】单词块1.8

【虎虎生威】单词块1.8 【楼主点评】:背单词神器,大小超出了界限,用的百度网盘! 【应用名称】:单词块 【应用包名】:base.apk 【应用版本】:1.8 【应用大小】:148.0MB 【适用平台】:Android 6.0 【版本说明】: -测试模式体验优化 -单词本显示优化 【官方介绍】:欢迎使用“单词块”,这是一款颠覆式创新设计的背单词应用。它能让您单词学习的体验变得极其爽快和扎实。 您可以将想要学习的单词加入“单词块”,按照应用的指导背诵和测试这些单词。 AI人工智能会追踪每一次学习过程,评估出您对每个单词的掌握程度,并提醒在合适的时间进行复习。富有现代感的全新设计,更能为您带来前所未有的沉浸式体验。 “单词块”的设计理念是回归背单词的本质,不预设任何学习方法,而是把精力重点放在做好词库质量、交互体验、记忆进度管理、AI人工智能技术等方面。给予用户最高的自由度,让用户自己去挖掘最适合自己的使用方法。 ■色彩记忆系统 进入应用里,您会看见各个单词以不同的颜色显示在界面上。这就是“单词块”创新的色彩记忆系统。每一种颜色代表着您对这个单词的熟悉程度,而熟悉度由系统根据您的每一次学习状态由AI智能算法分析计算得出。您可以通过颜色块直观的了解到哪些单词自己比较熟悉或者陌生、哪些单词刚刚学过、哪些单词正处于遗忘时期需要尽快复习等。 “单词块”里的每一个颜色都经过设计师精挑细选,力求以直观易懂的方式呈现给用户,漂亮的色彩搭配可以增加单词学习的爽快度和趣味性,降低学习过程中的枯燥感。 ■AI算法与深度学习 普通背单词应用的艾宾浩斯记忆曲线都是固定的,只会根据预设好的时间间隔来提醒用户复习,比较僵硬。 而“单词块”里的每一个单词都有独立的记忆曲线。通过大量用户的学习情况作为样本,训练出“单词遗忘曲线”的映射,进而推导出“词根遗忘曲线”,然后在漫长的英语学习中不断的利用这个映射和修正这个映射。力求用更加科学客观的方法来反馈用户的学习水平和勤奋程度。目前这个体系还未全部开放出来,后续的版本将会不断完善。 ■词库介绍 本应用的单词数据库根据各类考试大纲和语料库词频收录数十万条各类单词的英文和中文释义,整合了市面上各类免费和开源资料,利用 BNC/COCA 语料库进行词频矫正,并使用 NodeBox, WordNet 等自然语言处理工具包对各类时态语态 【测试截图】: 【下载地址】: 百度网盘链接:https://pan.baidu.com/s/1PzPmLtwc4LZK8ny0SQmq-A  提取码:8371

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人