Meta发布全新大型语言模型LLaMA，加入硅谷AI竞赛

Meta发布全新大型语言模型LLaMA，加入硅谷AI竞赛当地时间2月24日，Meta公司发布一款新的人工智能大型语言模型LLaMA，加入微软、谷歌等硅谷公司的竞赛。Meta首席执行官扎克伯格在Instagram表示，LLaMA模型旨在帮助研究人员推进工作，在生成文本、对话、总结书面材料、证明数学定理或预测蛋白质结构等更复杂的任务方面“有很大的前景”。Meta表示，在大多数基准测试中，参数仅为十分之一的LLaMA-13B的性能优于OpenAI推出的GPT3(175B)，也即支持ChatGPT的GPT3.5的前身。来源，来自：雷锋频道：@kejiqu 群组：@kejiquchat 投稿：@kejiqubot

在Telegram中查看

相关推荐

Meta宣布推出大型语言模型LLaMA，加入到由微软、谷歌等科技巨头主导的AI“军备竞赛”中

Meta宣布推出大型语言模型LLaMA，加入到由微软、谷歌等科技巨头主导的AI“军备竞赛”中当地时间2月24日，Meta宣布将推出针对研究社区的“Meta人工智能大型语言模型”系统（Large Language Model Meta AI），简称“LLaMA”。同ChatGPT、New Bing不同，LLaMA并不是一个任何人都可以与之对话的产品，也并未接入任何Meta应用。更为确切地说，该产品将是一个开源的“研究工具”。公司CEO扎克伯格在社交媒体上表示，LLaMA旨在帮助研究人员推进研究工作，LLM（大型语言模型）在文本生成、问题回答、书面材料总结，以及自动证明数学定理、预测蛋白质结构等更复杂的方面也有很大的发展前景。标签: #Meta #ChatGPT #AI 频道: @GodlyNews1 投稿: @GodlyNewsBot

Meta 确认其 Llama 3 开源大型语言模型将于下个月推出

Meta 确认其 Llama 3 开源大型语言模型将于下个月推出在4月9日于伦敦举行的一次活动中，Meta 确认计划在下个月内首次发布 Llama 3，这是用于驱动生成式人工智能助手的下一代大型语言模型。Meta 全球事务总裁 Nick Clegg 说：“在接下来的一个月内，实际上更短，我们希望开始推出我们的新一代模型套件 Llama 3。”他的描述听起来像是要发布该产品的几个不同迭代或版本。“今年[发布]的不同版本，将有许多不同的模型具有不同的功能，而且很快就会开始。”Meta 首席产品官 Chris Cox 补充说，该计划将通过 Llama 3 为 Meta 的多种产品提供动力。

OpenAI 即将发布一款全新的开源大型语言模型

OpenAI 即将发布一款全新的开源大型语言模型 The Information 引用了一位了解该计划的人士的话说，OpenAI 正面临着来自开源AI模型的激烈竞争，例如 Meta 的 LLaMA 与它的衍生模型，OpenAI 目前正准备向公众发布一款全新的开源语言模型。报告还称，OpenAI 不太可能发布与 GPT-4 和 GPT-3.5 竞争的模型。

Meta 正开发更强大的新大型语言模型，对标OpenAI 的 GPT-4

Meta 正开发更强大的新大型语言模型，对标OpenAI 的 GPT-4 据知情人士透露，Meta 正在开发一款新的大型语言模型，并预计其功能将与 GPT-4 一样强大。根据 Meta 的目标，其新 AI 模型将比两个月前刚刚发布的名为 Llama 2 的模型强大数倍。这个新 AI 模型计划明年上线。 Meta 目前正在搭建这项工作所需的数据中心，并购置更多的 H100 芯片，这是英伟达用于此类 AI 训练的最先进制程芯片。其中一些知情人士说，虽然与微软合作在后者的云计算平台 Azure 上提供 Llama 2 服务，但 Meta 计划在自己的基础设施上训练这个新模型。

Meta 推出 AI 编程工具 Code Llama，商业领域免费可用

Meta 推出 AI 编程工具 Code Llama，商业领域免费可用 Meta 现推出了一个名为的 AI 编码工具，号称“最先进的大型编码语言模型”。该模型基于 Llama 2 大型语言模型打造，可以理解为“Llama 2 的写代码专用版”，可用于“生成新的代码并调试人类编写的工作”，目前已上线 Github。 Meta 指出，Code Llama 能够根据代码核自然语言提示 / 要求生成你想要的代码和有关代码的自然语言，或者在指向特定代码时进行完善和调试。除了基础版的 Code Llama 外，Meta 还推出了专为 Python 设计的版本 Code Llama-Python，以及一个能够理解自然语言指令的版本 Code Llama-Instrct。据悉，Code Llama 将采用与 Llama 2 相同的社区许可，并对研究和商业领域免费开放。来源，频道：@kejiqu 群组：@kejiquchat 投稿：@kejiqubot

Meta 新语言模型能运行在单张显卡上

Meta 新语言模型能运行在单张显卡上 Meta 上周宣布了一个新的大语言模型 LLaMA-13B，称其参数规模更小但性能强于 OpenAI 的 GPT-3 模型，且它能运行在单张显卡上。语言模型的规模在从 70 亿到 650 亿参数，而 OpenAI GPT-3 模型有 1750 亿个参数。Meta 使用 Common Crawl、维基百科和 C4 等公开数据集训练其模型，它有可能公开其源代码和权重。今天绝大部分最先进的语言模型都没有公开源代码。Meta 称 LLaMA 为其基础模型，它将是未来该公司更先进模型的基础。它的 LLaMA-13B 模型在 BoolQ、PIQA、SIQA、HellaSwag、WinoGrande、ARC 和 OpenBookQA 等标准测试中的表现超过了 GPT-3。GPT-3 等衍生模型需要数据中心规模的计算能力进行处理，而 LLaMA-13B 能运行在单张显卡上，为在消费者硬件上实现类似 ChatGPT 的性能打开了大门。来源，来自：雷锋频道：@kejiqu 群组：@kejiquchat 投稿：@kejiqubot

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人