a16z近期公布了他们的开源 AI 资助计划第二期，主要关注两个领域：包括用于训练、托管和评估语言模型的工具以及围绕视觉人工智能

a16z近期公布了他们的开源 AI 资助计划第二期，主要关注两个领域：包括用于训练、托管和评估语言模型的工具以及围绕视觉人工智能构建的模型和社区。第二期有7 个项目：：一个在任何云上运行LLMs、AI和批处理作业的框架，提供最大的成本节省、最高的GPU可用性和托管执行。主要能力有：在任何云上启动作业和集群、排队并运行多个作业，自动管理、轻松访问对象存储、自动选择最便宜的云服务。：用于微调LLMs的工具，支持多种配置和架构。工具支持：训练各种Huggingface模型，如llama、pythia等、支持全面微调、lora、qlora、relora和gptq多种训练方式、使用简单的yaml文件或CLI覆盖自定义配置等。还有很多其他特性。：开源模型、系统和评估平台。开源了 LLM 用的数据集，还有一个 LLM 模型。最著名的还是通过 ELO 算法和机制评估 LLM 质量的项目，这种人工评分的机制比一些数据集的评价方法更加可以反应人类对于 LLM 质量的判断。：用于训练许多LLMs的开放网络爬取数据存储库。这是一个从 2007 年就开始收集的互联网语聊数据库，他们会定期抓取，你可以免费下载所有数据用来训练模型。GPT-3 82%的训练语料来自这个项目。：开源多模态模型（语言和视觉）。端到端训练的大型多模态模型，连接了一个视觉编码器和LLM，用于通用的视觉和语言理解。现在最新的是LLaVA1.5 版本，只是对原始LLaVA进行简单修改，利用了所有公开数据，在单个8-A100节点上约1天内完成训练。：AI动画的平台和开源社区，是一种 AI 生成动画的方式。Deforum的 WebUI 插件和 Discord 社区都是他们在维护。：高影响力AI模型的开放实现。 Phil Wang，也以其在线昵称“lucidrains”而闻名，在AI和机器学习领域是一位杰出人物。以在PyTorch框架中实现各种有趣的AI模型和论文而闻名。他的工作包括Vision Transformer、DALL-E 2、Imagen和MusicLM等的实现。

在Telegram中查看

相关推荐

Meta 开源计算机视觉基础模型 DINOv2

Meta 开源计算机视觉基础模型 DINOv2 Meta 开源了它的计算机视觉基础模型 DINOv2，源代码托管在上，和 Meta 近期开源的其它 AI 模型一样，采用的是非商用的 CC-BY-NC 4.0 许可证。DINOv2 是基于 Vision Transformer (ViT)架构，使用一个包含 1.42 亿幅图像的精选数据集进行预训练，可用于图像分类、视频动作识别、语义分割和深度估计等任务。Meta 称 DINOv2 模型的速度是旧方法的两倍，使用的内存只有旧方法的三分之一。测试显示它相比其它同类模型有显著改进。来源，来自：雷锋频道：@kejiqu 群组：@kejiquchat 投稿：@kejiqubot

IBM 开源 Granite 代码模型

IBM 开源 Granite 代码模型 IBM 开源了它用于辅助编程的代码模型，源代码托管在 GitHub 上，采用 Apache License 2.0 许可证，允许商业使用。与其它 AI 模型不同的是，IBM 致力于避免模型的版权问题，使用了开放数据集如 GitHub Code Clean、Starcoder、开放代码库和 GitHub issues 等进行训练。Granite 是 decoder-only 代码模型，可用于修 bug、解释代码和生成代码文档，使用了 116 种编程语言的代码进行训练，参数规模 30 亿、80 亿、200 亿和 340 亿。IBM 称测试显示 Granite 在开源代码模型中表现最出色。来源，频道：@kejiqu 群组：@kejiquchat

苹果公司发表四款开源新模型有助于提高未来人工智能的准确性

苹果公司发表四款开源新模型有助于提高未来人工智能的准确性这些指导模型被称为开源高效 LLMs 或 OpenELMs，托管在协作平台 Hugging Face 上。Hugging Face 用于托管人工智能模型，以及对其进行训练和与他人合作改进。OpenELM 是指一个开源库，它利用进化算法将多个大型语言模型 (LLM) 结合在一起。这四个 OpenELM 模型采用"分层缩放策略"，在变压器机器学习模型的各层中分配参数，以提高精确度。这些模型使用 CoreNet 库进行了预训练。苹果公司提供了使用 2.7 亿、4.5 亿、11 亿和 30 亿个参数的预训练和指令调整模型。预训练数据集由 Dolma v1.6 子集、RefinedWeb、重复 PILE 和 RedPajama 子集组合而成。这样得到的数据集约有 1.8 万亿个标记。在本周二发布的一篇相关论文中，该项目的研究人员表示，大型语言模型的可重复性和透明度"对于推进开放式研究至关重要"。它还有助于确保结果的可信度，并允许对模型偏差和风险进行调查。至于模型的准确性，据解释，在使用 10 亿个参数预算的情况下，OpenELM 比 OLMo 的准确性提高了 2.36%，而所需的预训练代币数量仅为 OLMo 的一半。模型和论文的作者包括 Sachin Mehta、Mohammad Hossein Sekhavat、Qingqing Cao、Maxwell Horton、Yanzi Jin、Chenfan Sun、Iman Mirzadeh、Mahyar Najibi、Dmitry Belenko、Peter Zatloukal 和 Mohammad Rastegari。发布这些模型的源代码是苹果公司宣传其人工智能和机器学习发展成果的最新尝试。这并不是苹果公司第一次公开发布人工智能程序。今年10 月，苹果分享了一个名为 Ferret 的开源 LLM，它改进了模型分析图像的方式。今年 4 月，Ferret 的新版本增加了解析应用程序截图中数据点的功能，并能大致了解应用程序的功能。此外，还发布了关于生成式人工智能动画工具和创建人工智能头像的论文。预计 6 月份的 WWDC 将包括苹果产品在人工智能方面的许多进展。 ... PC版：手机版：

开源 AI、大模型和许可证

开源 AI、大模型和许可证在前不久举行的 FOSDEM 2024 会议上，有多场演讲探讨了开源 AI、许可证中的伦理限制和开源数据集。训练大模型需要投入大量的算力和资金，企业如 OpenAI 既没有公开模型也没有发布数据集，但这没有阻止各类企业和组织发布开源大模型，这些开源模型使用了不同的许可证，有着不同的限制。以 Meta 的 Llama 2 大模型为例，它禁止将大模型用于暴力或恐怖活动，以及“任何其他犯罪活动”。欧洲自由软件基金会（FSFE）的项目经理 Niharika Singhal 认为，为了维护 AI 的“开放性”，AI 模型的许可证必须与自由软件许可证有互操作性。许可证不能代替监管，此类对道德的限制不应该包含在许可证中，这些属于监管范围。开源促进会（Open Source Initiative）正致力于对开源 AI 进行定义，它认为如果一个模型被归类为开源，它需要具有开源软件所拥有的四个基本自由使用、学习、分享及改善之自由。开源促进会计划在今年 10 月底发布开源 AI 定义的 1.0 版本。来源，频道：@kejiqu 群组：@kejiquchat

Databricks 5000名员工原创了15000个比GPT质量更好的数据集用于Dolly 2.0，并开源

Databricks 5000名员工原创了15000个比GPT质量更好的数据集用于Dolly 2.0，并开源 Databricks：我们正在开源整个，包括训练代码、数据集和模型权重，所有这些都适合商业用途。这意味着任何组织都可以创建、拥有和定制可以与人交谈的强大 LLM，而无需支付 API 访问费用或与第三方共享数据。如何开始？要下载 Dolly 2.0 模型砝码，只需访问页面并访问上的 Dolly 存储库以下载 .并加入我们的，了解如何为您的组织利用LLM。来源，来自：雷锋频道：@kejiqu 群组：@kejiquchat 投稿：@kejiqubot

不是所有声称开源的 AI 模型是真的开源

不是所有声称开源的 AI 模型是真的开源 AI 研究人员表示，Meta 和微软等科技巨头称其 AI 模型是开源模型，但它们并没有披露模型底层技术的重要信息。荷兰 Radboud 大学语言科学家 Mark Dingemanse 表示，大公司正从宣称开源模型上受益，但与此同时试图尽可能少的披露信息。这种做法被称为“open-washing”。Dingemanse 指出，相比下资源更少的小型 AI 企业则表现更令人称赞。他和同事创建了一个最开放和最不开放模型排行榜。他们评估了 40 个声称开源或开放的大模型，根据代码和训练数据的可用性、文档以及模型易访问性等 14 个参数制定了排行榜。研究人员发现， Meta 的 Llama 以及 Google DeepMind 的 Gemma 虽然自称开源或开放，但实际上只是开放权重，外部研究人员可以访问和使用预训练模型，但无法检查或定制模型，也不知道模型如何针对特定任务进行微调。根据他们的排行榜，BigScience 的 BloomZ 是最开源开放的模型，其次是 Allen Institute for AI 的 OLMo，Mistral AI 的 Mistral 7B-Instruct。 via Solidot

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人