AI 大事记：Apple 带来开源模型的运行软件框架MLX

AI 大事记：Apple 带来开源模型的运行软件框架MLX 今天由Apple 研究团队发布了MLX，一个高效的机器学习框架，专为苹果芯片（即M系列）设计。视频为 MLX 实现的 Llama v1 7B 模型，在 M2 Ultra 上运行。参考要点 - Apple AI 研究科学家 Awni Hannum 提供了演示视频， MLX 有各种示例，包括支持训练Transformer大模型或使用 LoRA 进行微调；使用 Mistral 生成文本；利用Stable Diffusion 生成图像；使用 Whisper 进行语音识别。 - MLX 是 Apple 芯片上用于机器学习的阵列框架，由 Apple 机器学习研究团队提供。 - Jim Fan 评价为，这可能是苹果公司迄今为止在开源人工智能方面的最大举措。该版本在设计深度学习受众熟悉的 API 方面做得非常出色，并在大多数人关心的开放源码软件模型上展示了极简的示例：Llama、LoRA、Stable Diffusion 和 Whisper。 MLX Github地址：文档齐全、独立的示例库： Invalid media:

在Telegram中查看

相关推荐

，在 Mac 上原生运行 Stable Diffusion

，在 Mac 上原生运行 Stable Diffusion 本应用内置 Apple 的 Core ML Stable Diffusion 框架以实现在搭载 Apple 芯片的 Mac 上用极低的内存占用发挥出最优性能，并同时兼容搭载 Intel 芯片的 Mac。功能极致性能和极低内存占用 (使用神经网络引擎时 ~150MB) 在所有搭载 Apple 芯片的 Mac 上充分发挥神经网络引擎的优势生成图像时无需联网图像转图像（也被称为 Image2Image）在图像的 EXIF 信息中存储所有的关键词（在访达的“显示简介”窗口中查看）使用 RealESRGAN 放大生成的图像自动保存 & 恢复图像自定义 Stable Diffusion Core ML 模型无需担心损坏的模型使用 macOS 原生框架 SwiftUI 开发

现在AI模型很多，通常需要连接多个模型才能完成任务，这个产品让你可以用可视化的方式，简单的拖拽和输入就可以将几个AI模型按照顺序

现在AI模型很多，通常需要连接多个模型才能完成任务，这个产品让你可以用可视化的方式，简单的拖拽和输入就可以将几个AI模型按照顺序拼接起来。| 支持的模型包括GPT、Whisper、Stable Diffusion、ControlNet Canny、BLIP-2等

：一个Swift开发包，它将OpenAI流行的Whisper语音识别模型与Apple的CoreML框架集成在一起，可在 Appl

：一个Swift开发包，它将OpenAI流行的Whisper语音识别模型与Apple的CoreML框架集成在一起，可在 Apple 设备上进行高效的本地推理，可通过Swift软件包管理器集成到 Swift 项目中。

Stability AI发布最新图像生成模型Stable Diffusion XL 1.0

Stability AI发布最新图像生成模型Stable Diffusion XL 1.0 今天，Stability AI 宣布推出 Stable Diffusion XL 1.0，这是该公司迄今为止描述为“最先进”的文本到图像模型。Stable Diffusion XL 1.0 可在上以开源形式使用，并提供给 Stability 的和消费者应用程序和。Stability 声称，与其前代产品相比，Stable Diffusion XL 1.0 提供了“更生动”和“更准确”的颜色，更好的对比度、阴影和照明效果。在接受采访时，Stability AI 的应用机器学习负责人Joe Penna 指出，Stable Diffusion XL 1.0 包含 35亿个参数，可以“在几秒钟内”生成多种长宽比的 100万像素分辨率的完整图像。“参数”是模型从训练数据中学习到的部分，基本上定义了模型在解决问题上的技能水平。上一代稳定扩散模型稳定扩散 XL 0.9 也可以生成更高分辨率的图像，但需要更多的计算能力。、

Stable Audio Open 开源 AI 模型发布

Stable Audio Open 开源 AI 模型发布 Stability AI 立足 Stable Diffusion 文生图模型，进一步向音频领域拓展，推出了，可以基于用户输入的提示词，生成高质量音频样本。 Stable Audio Open 最长可以创建 47 秒的音乐，非常适合鼓点、乐器旋律、环境音和拟声音效，该开源模型基于 transforms 扩散模型（DiT），在自动编码器的潜在空间中操作，提高生成音频的质量和多样性。 Stable Audio Open 目前已经开源，感兴趣的用户可以在上试用。据说它使用了来自 FreeSound 和 Free Music Archive 等音乐库的 486000 多种采样进行训练。Stability AI 公司表示：“虽然它可以生成简短的音乐片段，但并不适合完整的歌曲、旋律或人声”。 Stable Audio Open 和 Stable Audio 2.0 不同是，前者为开源模型，专注于短音频片段和音效，而后者能够生成最长 3 分钟的完整音频。来源，频道：@kejiqu 群组：@kejiquchat

：Stability AI最新推出的高级文本到图像AI模型，适合在消费级PC、笔记本及企业级GPU上运行，有望成为文本到图像模型

：Stability AI最新推出的高级文本到图像AI模型，适合在消费级PC、笔记本及企业级GPU上运行，有望成为文本到图像模型的新标准 - Stability AI公开发布了Stable Diffusion 3 Medium图像生成模型，这是目前该公司最先进的开源文本到图像模型。 - Stable Diffusion 3 Medium是一个20亿参数量的模型，相比之前的模型有显著改进：整体图像质量和逼真度大幅提升，能够生成高质量的照片逼真图像；理解长难句子描述的能力增强；文字质量也有很大提升，减少拼写、字间距等错误。 - 该模型大小适中，非常适合在普通消费级PC和笔记本电脑上运行，也能在企业级GPU上充分发挥性能。它有望成为文本到图像模型的新标准。 - Stable Diffusion 3 Medium在Stability非商业研究社区许可证下对外开源。对于商业用途，鼓励使用新的Creator许可证。大规模商业使用还需联系Stability取得企业许可证。 - 用户可以通过Stability的API、Stable Assistant和Stable Artisan等渠道试用Stable Diffusion 3 Medium。 - Stability AI表示会根据用户反馈持续改进该模型，扩展其功能，提升性能。目标是为艺术创作和业余用户都设定一个新的标准。 - Stability AI坚持开放和负责任的AI实践，在模型的训练、测试、部署等各个阶段采取合理措施防止模型被恶意滥用。

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人