苹果发布可在本地运行的开放模型 OpenELM

苹果发布可在本地运行的开放模型OpenELM苹果发布了它的开放模型，可以在本地设备而不是云端运行。OpenELM的权重、训练的不同检查点（checkpoints）、预训练评估微调等的指南都公布在HuggingFace平台上。示例代码许可并不禁止商业使用或修改，只是要求在重新发布时包含苹果完整且没有修改过的声明。OpenELM由一组旨在高效执行文本生成任务的小模型组成，共八个模型，四个预训练四个指令微调，参数规模从2.7亿到30亿。来源，频道：@kejiqu群组：@kejiquchat

在Telegram中查看

相关推荐

苹果发布 OpenELM 大语言模型，基于开源训练和推理框架的语言模型

苹果发布OpenELM大语言模型，基于开源训练和推理框架的语言模型在WWDC24之前，苹果在HuggingFace平台上发布了一个“具有开源训练和推理框架的高效语言模型”，名为OpenELM。苹果这次发布了完整的框架，包括数据准备、训练、微调和评估程序，以及多个预训练的checkpoint和训练日志，以促进开源研究。其源码及预训练的模型权重和训练配方可在苹果Github库中获取。

苹果开源 OpenELM 系列语言模型

苹果在HuggingFace上最新推出了OpenELM系列语言模型。OpenELM总共有8个模型，包括270M、450M、1.1B和3B这四个参数规模（分为预训练版和指令微调版）。它们使用了总计约1.8万亿个token的多个公共数据集。目前，OpenELM的代码、预训练模型权重以及训练和评估流程全部开放。标签:#Apple#AI频道:@GodlyNews1投稿:@GodlyNewsBot

Ollama：在本地启动并运行大语言模型 | #工具

：在本地启动并运行大语言模型#工具Ollama是一款命令行工具，可在macOS和Linux上本地运行Llama2、CodeLlama和其他模型。适用于macOS和Linux，并计划支持Windows。Ollama目前支持近二十多个语言模型系列，每个模型系列都有许多可用的"tags"。Tags是模型的变体，这些模型使用不同的微调方法以不同的规模进行训练，并以不同的级别进行量化，以便在本地良好运行。量化级别越高，模型越精确，但运行速度越慢，所需的内存也越大。

苹果正利用大语言模型改造Siri 无需联网本地运行

苹果正利用大语言模型改造Siri无需联网本地运行随着ChatGPT的兴起，不少大厂到开始自研AI大模型，苹果出于安全考虑禁止员工使用ChatGPT。不过，有苹果员工曾抱怨Siri工作效率低下，Siri之所以逐渐走向没落，是因为内部团队混乱、决策缓慢、代码笨重，导致在Siri和AI开发上受到严重阻碍。如今，苹果打算加码AI，想必也是不少人所期待的，升级后的Siri据说在本地运行响应时间更快、不需要网络连接，且更具隐私性。...PC版：https://www.cnbeta.com.tw/articles/soft/1395647.htm手机版：https://m.cnbeta.com.tw/view/1395647.htm

Google 宣布辅助编程用的开放大模型 CodeGemma

Google宣布辅助编程用的开放大模型CodeGemmaGoogle宣布了辅助编程用的开放大模型，模型权重可以在上下载。CodeGemma是基于Google今年2月发布的轻量级开放大模型Gemma，针对Gemma的两个不同参数规模的版本Gemma2B和Gemma7B发布了CodeGemma2B和CodeGemma7B（有预训练和指令微调两种）。来源，频道：@kejiqu群组：@kejiquchat

摩根大通推测苹果 AI 发展策略：立足本地小模型管理大语言模型

摩根大通推测苹果AI发展策略：立足本地小模型管理大语言模型《科创板日报》20日讯，摩根大通近日发布投资备忘录，推测苹果的AI发展战略，认为苹果一方面专注于iPhone本地运行的小模型，另一方面通过和其它厂商合作引入大语言模型（LLM）。摩根大通认为相比较OpenAI的ChatGPT和谷歌的Gemini，苹果目前在大语言模型方面处于落后状态，苹果公司也深知这一点，因此将重心放在可以本地运行的小模型方面，从而更好地发挥自己的优势。

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人