简化大型语言模型训练的开源工具，提供了一种简洁的大型语言模型3D并行训练方法。#工具

Yandex开源大型语言模型训练工具YaFSDP跨国科技公司Yandex最近推出了用于训练大型语言模型的开源方法YaFSDP。Y

开源的、专为大型语言模型(LLM)友好设计的网页爬虫和抓取工具#工具

高效的大型语言模型(LLM)压缩工具，支持多种先进的压缩方法和多种推理后端#工具

苹果发布 OpenELM 大语言模型，基于开源训练和推理框架的语言模型

苹果发布OpenELM大语言模型，基于开源训练和推理框架的语言模型在WWDC24之前，苹果在HuggingFace平台上发布了一个“具有开源训练和推理框架的高效语言模型”，名为OpenELM。苹果这次发布了完整的框架，包括数据准备、训练、微调和评估程序，以及多个预训练的checkpoint和训练日志，以促进开源研究。其源码及预训练的模型权重和训练配方可在苹果Github库中获取。

：用于简化大型语言模型(LLM)结构化输出处理的Go语言库

马斯克开源大型语言模型 Grok-1

马斯克开源大型语言模型Grok-1Grok-1的权重和架构现已在Apache2.0许可证下发布在了github.com/xai-org/grokGrok-1是一个由xAI训练的3140亿参数专家混合模型(8个专家)，给定输入上有25%的活跃权重。该权重为2023年10月预训练结束时的原始权重，这意味着此时没有针对任何特定对话进行微调。线索：@ZaiHuabot投稿：@TNSubmbot频道：@TestFlightCN

相关推荐

Yandex开源大型语言模型训练工具YaFSDP跨国科技公司Yandex最近推出了用于训练大型语言模型的开源方法YaFSDP。Y

开源的、专为大型语言模型(LLM)友好设计的网页爬虫和抓取工具#工具

高效的大型语言模型(LLM)压缩工具，支持多种先进的压缩方法和多种推理后端#工具

苹果发布 OpenELM 大语言模型，基于开源训练和推理框架的语言模型

：用于简化大型语言模型(LLM)结构化输出处理的Go语言库

马斯克开源大型语言模型 Grok-1