苹果发布OpenELM，基于开源训练和推理框架的高效语言模型-IT之家https://www.ithome.com/0/763/

苹果发布 OpenELM 大语言模型，基于开源训练和推理框架的语言模型

苹果发布OpenELM大语言模型，基于开源训练和推理框架的语言模型在WWDC24之前，苹果在HuggingFace平台上发布了一个“具有开源训练和推理框架的高效语言模型”，名为OpenELM。苹果这次发布了完整的框架，包括数据准备、训练、微调和评估程序，以及多个预训练的checkpoint和训练日志，以促进开源研究。其源码及预训练的模型权重和训练配方可在苹果Github库中获取。

libLLM: 专为在普通个人电脑和移动设备上高效推理大型语言模型（LLM）而设计的开源项目。

:专为在普通个人电脑和移动设备上高效推理大型语言模型（LLM）而设计的开源项目。核心使用C++14编写，没有第三方依赖（BLAS、SentencePiece等），能在各种设备中无缝运行。特点为日常设备进行优化：libLLM经过优化，可在常见的个人电脑上平稳运行，确保大型语言模型的强大功能面向更广泛的用户。C++代码：采用标准C++14编写，简单高效。无外部依赖：核心功能无需第三方依赖（BLAS、SentencePiece等），所需的GEMM内核均在内部实现(avx2、avx512)。支持CUDA：支持使用CUDA加速推理。

苹果发布OpenELM，基于开源训练和推理框架的高效语言模型-IT之家https://www.ithome.com/0/763/

相关推荐

苹果发布 OpenELM 大语言模型，基于开源训练和推理框架的语言模型

libLLM: 专为在普通个人电脑和移动设备上高效推理大型语言模型（LLM）而设计的开源项目。

DeepMind：大型语言模型可实现“高效无损压缩音频影像”，有望运用于相关软件中-IT之家https://www.ithome.com/0/722/142.htm

Yandex开源大型语言模型训练工具YaFSDP跨国科技公司Yandex最近推出了用于训练大型语言模型的开源方法YaFSDP。Y

Mathematica引入大语言模型，网友：买买买-IT之家https://www.ithome.com/0/703/819.htm

-SiliconLLMTraining&InferenceToolkit：基于MLX框架的SiliconLLM训练和推理工具包，