AI 大事记:Apple 带来开源模型的运行软件框架MLX

AI 大事记:Apple 带来开源模型的运行软件框架MLX 今天由Apple 研究团队发布了MLX,一个高效的机器学习框架,专为苹果芯片(即M系列)设计。视频为 MLX 实现的 Llama v1 7B 模型,在 M2 Ultra 上运行。 参考要点 - Apple AI 研究科学家 Awni Hannum 提供了演示视频, MLX 有各种示例,包括支持训练Transformer大模型或使用 LoRA 进行微调;使用 Mistral 生成文本;利用Stable Diffusion 生成图像;使用 Whisper 进行语音识别。 - MLX 是 Apple 芯片上用于机器学习的阵列框架,由 Apple 机器学习研究团队提供。 - Jim Fan 评价为,这可能是苹果公司迄今为止在开源人工智能方面的最大举措。该版本在设计深度学习受众熟悉的 API 方面做得非常出色,并在大多数人关心的开放源码软件模型上展示了极简的示例:Llama、LoRA、Stable Diffusion 和 Whisper。 MLX Github地址: 文档齐全、独立的示例库: Invalid media:

相关推荐

封面图片

现在AI模型很多,通常需要连接多个模型才能完成任务,这个产品让你可以用可视化的方式,简单的拖拽和输入就可以将几个AI模型按照顺序

现在AI模型很多,通常需要连接多个模型才能完成任务,这个产品让你可以用可视化的方式,简单的拖拽和输入就可以将几个AI模型按照顺序拼接起来。| 支持的模型包括GPT、Whisper、Stable Diffusion、ControlNet Canny、BLIP-2等

封面图片

,在 Mac 上原生运行 Stable Diffusion

,在 Mac 上原生运行 Stable Diffusion 本应用内置 Apple 的 Core ML Stable Diffusion 框架 以实现在搭载 Apple 芯片的 Mac 上用极低的内存占用发挥出最优性能,并同时兼容搭载 Intel 芯片的 Mac。 ​​​ 功能 极致性能和极低内存占用 (使用神经网络引擎时 ~150MB) 在所有搭载 Apple 芯片的 Mac 上充分发挥神经网络引擎的优势 生成图像时无需联网 图像转图像(也被称为 Image2Image) 在图像的 EXIF 信息中存储所有的关键词(在访达的“显示简介”窗口中查看) 使用 RealESRGAN 放大生成的图像 自动保存 & 恢复图像 自定义 Stable Diffusion Core ML 模型 无需担心损坏的模型 使用 macOS 原生框架 SwiftUI 开发

封面图片

Stability AI发布最新图像生成模型Stable Diffusion XL 1.0

Stability AI发布最新图像生成模型Stable Diffusion XL 1.0 今天,Stability AI 宣布推出 Stable Diffusion XL 1.0,这是该公司迄今为止描述为“最先进”的文本到图像模型。Stable Diffusion XL 1.0 可在上以开源形式使用,并提供给 Stability 的和消费者应用程序和 。Stability 声称,与其前代产品相比,Stable Diffusion XL 1.0 提供了“更生动”和“更准确”的颜色,更好的对比度、阴影和照明效果。 在接受采访时,Stability AI 的应用机器学习负责人Joe Penna 指出,Stable Diffusion XL 1.0 包含 35亿个参数,可以“在几秒钟内”生成多种长宽比的 100万像素分辨率的完整图像。“参数”是模型从训练数据中学习到的部分,基本上定义了模型在解决问题上的技能水平。 上一代稳定扩散模型稳定扩散 XL 0.9 也可以生成更高分辨率的图像,但需要更多的计算能力。 、

封面图片

:一个Swift开发包,它将OpenAI流行的Whisper语音识别模型与Apple的CoreML框架集成在一起,可在 Appl

:一个Swift开发包,它将OpenAI流行的Whisper语音识别模型与Apple的CoreML框架集成在一起,可在 Apple 设备上进行高效的本地推理,可通过Swift软件包管理器集成到 Swift 项目中。

封面图片

Stable Audio Open 开源 AI 模型发布

Stable Audio Open 开源 AI 模型发布 Stability AI 立足 Stable Diffusion 文生图模型,进一步向音频领域拓展,推出了 ,可以基于用户输入的提示词,生成高质量音频样本。 Stable Audio Open 最长可以创建 47 秒的音乐,非常适合鼓点、乐器旋律、环境音和拟声音效,该开源模型基于 transforms 扩散模型(DiT),在自动编码器的潜在空间中操作,提高生成音频的质量和多样性。 Stable Audio Open 目前已经开源,感兴趣的用户可以在上试用。据说它使用了来自 FreeSound 和 Free Music Archive 等音乐库的 486000 多种采样进行训练。Stability AI 公司表示:“虽然它可以生成简短的音乐片段,但并不适合完整的歌曲、旋律或人声”。 Stable Audio Open 和 Stable Audio 2.0 不同是,前者为开源模型,专注于短音频片段和音效,而后者能够生成最长 3 分钟的完整音频。来源 , 频道:@kejiqu 群组:@kejiquchat

封面图片

苹果推出 MLX 深度学习框架

苹果推出 MLX 深度学习框架 苹果今日在其开发者官网发布了专为 Apple Silicon 芯片优化的 MLX 深度学习框架「ml-explore」。 根据介绍:「ml-explore」可以帮助开发者简化设计和部署模型的过程,并使用熟悉的 API 来完成开发。作为第一方软件,「ml-explore」能够充分利用 Apple Silicon 的 CPU 与 GPU,并利用统一内存架构进一步加强性能。

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人