Python自动语音识别框架#框架“SpeeQ”，发音为“speekiu”，是一个基于Python的语音识别框架，允许开发人员和研究人员试验和训练各种语音识别模型。它提供了预实现的模型架构，只需几行代码即可进行训练，使其成为语音识别模型快速原型设计和测试的合适选择。

谷歌与 Hugging Face 合作，帮助开发人员训练 AI 模型

谷歌与HuggingFace合作，帮助开发人员训练AI模型谷歌云与AI模型托管平台HuggingFace建立了新的合作伙伴关系，让开发人员无需支付谷歌云订阅费用即可构建、训练和部署AI模型。现在，使用HuggingFace平台的外部开发人员将能够“经济高效”地访问谷歌的张量处理单元(TPU)和GPU超级计算机，其中包括数千台Nvidia的热门且出口受限的H100。谷歌表示，HuggingFace用户可以在“2024年上半年”开始使用人工智能应用构建平台VertexAI和Kubernetes引擎，帮助训练和微调模型。一一

EasyVoiceToolkit简易语音工具箱-AI轻松音频处理、语音识别、模型训练、语音合成支持中英日文标签：#AI#wind

-超多方言ASR：支持30多种方言的语音识别模型，打破单一模型方言限制，提供多方言语音数据训练的开源版本，适用于多方言语音识别任

：快速构建LLM语音聊天应用的关键框架，帮助开发人员轻松打造高效的应用

苹果发布 OpenELM 大语言模型，基于开源训练和推理框架的语言模型

苹果发布OpenELM大语言模型，基于开源训练和推理框架的语言模型在WWDC24之前，苹果在HuggingFace平台上发布了一个“具有开源训练和推理框架的高效语言模型”，名为OpenELM。苹果这次发布了完整的框架，包括数据准备、训练、微调和评估程序，以及多个预训练的checkpoint和训练日志，以促进开源研究。其源码及预训练的模型权重和训练配方可在苹果Github库中获取。

TencentPretrain：腾讯预训练模型框架

TencentPretrain：腾讯预训练模型框架预训练已经成为人工智能技术的重要组成部分，为大量人工智能相关任务带来了显著提升。TencentPretrain是一个用于对文本、图像、语音等模态数据进行预训练和微调的工具包。TencentPretrain遵循模块化的设计原则。通过模块的组合，用户能迅速精准的复现已有的预训练模型，并利用已有的接口进一步开发更多的预训练模型。通过TencentPretrain，我们建立了一个模型仓库，其中包含不同性质的预训练模型（例如基于不同模态、编码器、目标任务）。用户可以根据具体任务的要求，从中选择合适的预训练模型使用。TencentPretrain继承了的部分工作，并在其基础上进一步开发，形成支持多模态的预训练模型框架。TencentPretrain有如下几方面优势:可复现TencentPretrain已在许多数据集上进行了测试，与原始预训练模型实现（例如BERT、GPT-2、ELMo、T5、CLIP）的表现相匹配模块化TencentPretrain使用解耦的模块化设计框架。框架分成Embedding、Encoder、Target等多个部分。各个部分之间有着清晰的接口并且每个部分包括了丰富的模块。可以对不同模块进行组合，构建出性质不同的预训练模型多模态TencentPretrain支持文本、图像、语音模态的预训练模型，并支持模态之间的翻译、融合等操作模型训练TencentPretrain支持CPU、单机单GPU、单机多GPU、多机多GPU训练模式，并支持使用DeepSpeed优化库进行超大模型训练模型仓库我们维护并持续发布预训练模型。用户可以根据具体任务的要求，从中选择合适的预训练模型使用SOTA结果TencentPretrain支持全面的下游任务，包括文本/图像分类、序列标注、阅读理解、语音识别等，并提供了多个竞赛获胜解决方案预训练相关功能TencentPretrain提供了丰富的预训练相关的功能和优化，包括特征抽取、近义词检索、预训练模型转换、模型集成、文本生成等#框架

相关推荐

谷歌与 Hugging Face 合作，帮助开发人员训练 AI 模型

EasyVoiceToolkit简易语音工具箱-AI轻松音频处理、语音识别、模型训练、语音合成支持中英日文标签：#AI#wind

-超多方言ASR：支持30多种方言的语音识别模型，打破单一模型方言限制，提供多方言语音数据训练的开源版本，适用于多方言语音识别任

：快速构建LLM语音聊天应用的关键框架，帮助开发人员轻松打造高效的应用

苹果发布 OpenELM 大语言模型，基于开源训练和推理框架的语言模型

TencentPretrain：腾讯预训练模型框架