微软宣布开源DeepSpeedChat，帮助用户训练类ChatGPT等大语言模型

苹果发布 OpenELM 大语言模型，基于开源训练和推理框架的语言模型

苹果发布OpenELM大语言模型，基于开源训练和推理框架的语言模型在WWDC24之前，苹果在HuggingFace平台上发布了一个“具有开源训练和推理框架的高效语言模型”，名为OpenELM。苹果这次发布了完整的框架，包括数据准备、训练、微调和评估程序，以及多个预训练的checkpoint和训练日志，以促进开源研究。其源码及预训练的模型权重和训练配方可在苹果Github库中获取。

训练 ChatGPT 等模型不付钱？美国新闻集团拟起诉微软、谷歌、OpenAI

训练ChatGPT等模型不付钱？美国新闻集团拟起诉微软、谷歌、OpenAI华尔街日报报道，AI技术的发展已经引发了新闻出版业的不满，他们认为自己的内容被大型科技公司用于训练AI模型而没有得到合理的补偿。拥有《纽约邮报》、《巴伦周刊》、《华尔街日报》等的美国新闻集团正准备向OpenAI、微软和谷歌等公司提起诉讼，要求赔偿其内容在ChatGPT、Bard等AI工具中被用来使用的费用。当前这是一个复杂而模糊的法律问题，涉及到AI公司是否有权从互联网上抓取内容，并将其输入到训练模型中。一些批评者认为，这是一种工业规模的知识产权盗窃行为。出版商担心，AI工具可能会影响他们网站的流量和广告收入。事实上，AI版权问题并非始于ChatGPT。在图像和代码方面，已经有多起诉讼案件涉及到AI模型训练使用受版权保护的数据。例如，Midjourney、StabilityAI、微软、GitHub以及OpenAI都曾卷入相关纠纷。目前，对于AI创作是否受版权保护还没有形成固定的准则。法律人士认为，所有针对生成式AI的案件可能需要数年时间才能结案。科技公司与内容出版商进行协商寻求使用许可，或许是最好的解决办法。来源，来自：雷锋频道：@kejiqu群组：@kejiquchat投稿：@kejiqubot

Yandex开源大型语言模型训练工具YaFSDP跨国科技公司Yandex最近推出了用于训练大型语言模型的开源方法YaFSDP。Y

Sam 说没有在训练 ChatGPT 5，之后继续说大语言模型结束了。

Sam说没有在训练ChatGPT5，之后继续说大语言模型结束了。我的理解是：4已经把所有的优质信息吃完，继续喂语料其实是喂毒，也就没有5这个版本。我认为ChatGPT也应该慢下来，目前几乎是一天一个版本，第二天醒来发现自己昨天做的事情没有意义了，也就没有人愿意做长期的事情。安卓是一年一个版本，这个节奏就很好。好事是开源的语言模型可以以4为终极目标，这是大语言模型的最终形态。

Google 发布开源大语言模型 Gemma

Google发布开源大语言模型Gemma谷歌今天宣布推出Gemma，这是一个新的轻量级开源大语言模型系列。现在Gemma2B和Gemma7B两个模型已经可用，每个尺寸都发布了经过预训练和指令调整的变体。谷歌同时提供了多项工具以便快速部署该模型，包括开箱即用的Colab实例，可快速部署的容器镜像，以及和其它流行开发工具的集成。Gemma模型也能够直接在开发人员笔记本电脑或台式计算机上运行。根据谷歌的技术报告，该模型在多个测试中超越的Llama2等开源模型。这些新模型“受到Gemini的启发”，使用与其相似的架构，并被许可用于商业和研究用途。此外，谷歌还发布了一个新的负责任的生成式AI工具包，以提供“使用Gemma创建更安全的人工智能应用程序的指导和基本工具”以及调试工具。——,,

微软宣布开源DeepSpeedChat，帮助用户训练类ChatGPT等大语言模型

相关推荐

苹果发布 OpenELM 大语言模型，基于开源训练和推理框架的语言模型

训练 ChatGPT 等模型不付钱？美国新闻集团拟起诉微软、谷歌、OpenAI

Yandex开源大型语言模型训练工具YaFSDP跨国科技公司Yandex最近推出了用于训练大型语言模型的开源方法YaFSDP。Y

Sam 说没有在训练 ChatGPT 5，之后继续说大语言模型结束了。

Google 发布开源大语言模型 Gemma

简化大型语言模型训练的开源工具，提供了一种简洁的大型语言模型3D并行训练方法。#工具