RT 你们快速测了一下LLaMa，用的4B的模型，文件4个G。本地跑速度极快（3060显卡），m2的mac也极快（我没测，只有一

RT 你们快速测了一下LLaMa，用的4B的模型，文件4个G。本地跑速度极快（3060显卡），m2的mac也极快（我没测，只有一台乞丐版m1）。水平比GPT3差一点，明天测一下13B的那个数据。这个的意义在于能够离网本地跑，如果能把私人的数据向量化喂给它，做一个个人信息资料和信息助手，应该前景可以。

在Telegram中查看

相关推荐

《黑猫测压》简介：黑猫测压是一款网络测压工具，能对网络的稳定性、速度等进行测试。通过简单操作，快速获取网络的实时数据，帮助用户了

《黑猫测压》简介：黑猫测压是一款网络测压工具，能对网络的稳定性、速度等进行测试。通过简单操作，快速获取网络的实时数据，帮助用户了解网络状况，排查网络问题，优化网络使用体验标签： #黑猫测压 #网络测试 #网络优化 #网络诊断文件大小 NG资源序号: 4 更新日期: 2025/4/13 11:20:36 链接：https://pan.quark.cn/s/03d158a7bfc8

：用Rust编写的GPU加速语言模型(LLM)服务器，可高效提供多个本地LLM模型的服务。

：用Rust编写的GPU加速语言模型(LLM)服务器，可高效提供多个本地LLM模型的服务。主要提供：为多个本地 LLM 模型提供高性能、高效和可靠的服务可选择通过 CUDA 或 Metal 进行 GPU 加速可配置的 LLM 完成任务（提示、召回、停止令牌等）通过 HTTP SSE 流式传输完成响应，使用 WebSockets 聊天使用 JSON 模式对完成输出进行有偏差的采样使用向量数据库（内置文件或 Qdrant 等外部数据库）进行记忆检索接受 PDF 和 DOCX 文件并自动将其分块存储到内存中使用静态 API 密钥或 JWT 标记确保 API 安全简单、单一的二进制+配置文件服务器部署，可水平扩展附加功能：用于轻松测试和微调配置的 Web 客户端用于本地运行模型的单二进制跨平台桌面客户端

M1/M2芯片苹果电脑上的开源Stable Diffusion图形界面应用

M1/M2芯片苹果电脑上的开源Stable Diffusion图形界面应用 1.可在计算机上本地运行，没有数据发送到云端（除了请求下载权重和检查软件更新） 2.如果你喜欢 Diffusion Bee，可以看一下 Liner.ai，这是一个训练机器学习模型的一键工具系统要求 1.M1 / M2 麦克 2.首选 16 GB RAM。用 8GB 内存运行会有点慢。 3.MacOS 12.5.1 或更高版本 || #工具

现在可以在笔记本电脑、手机和 Raspberry Pi 上运行 GPT-3 级别的 AI 模型

现在可以在笔记本电脑、手机和 Raspberry Pi 上运行 GPT-3 级别的 AI 模型通常，运行 GPT-3 需要多个数据中心级A100 GPU（此外，GPT-3 的权重不公开），但 LLaMA 引起了轰动，因为它可以在单个强大的消费类 GPU 上运行。现在，通过使用一种称为量化的技术来减小模型大小的优化，LLaMA 可以在 M1 Mac 或较小的 Nvidia 消费者 GPU 上运行。周五，一位名叫 Georgi Gerganov 的软件开发人员创建了一个名为“”的工具，可以在 Mac 笔记本电脑本地运行 Meta 的新 GPT-3 类 AI 大型语言模型LLaMA 。此后不久，人们也想出了如何在。然后有人展示了它在 Pixel 6 手机上运行，接下来是（尽管运行速度非常慢）。如果这种情况持续下去，我们可能会在不知不觉中看到一个口袋大小的ChatGPT 竞争对手。在撰写本文时，在 Mac 上运行 LLaMA 仍然是一项相当技术性的练习。您必须安装 Python 和 Xcode 并熟悉在命令行上工作。威利森为任何想尝试的人提供了很好的。但随着开发人员继续编写代码，这种情况可能很快就会改变。来自：雷锋频道：@kejiqu 群组：@kejiquchat 投稿：@kejiqubot

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人