Meta发布全新大型语言模型LLaMA,加入硅谷AI竞赛

Meta发布全新大型语言模型LLaMA,加入硅谷AI竞赛 当地时间2月24日,Meta公司发布一款新的人工智能大型语言模型LLaMA,加入微软、谷歌等硅谷公司的竞赛。Meta首席执行官扎克伯格在Instagram表示,LLaMA模型旨在帮助研究人员推进工作,在生成文本、对话、总结书面材料、证明数学定理或预测蛋白质结构等更复杂的任务方面“有很大的前景”。Meta表示,在大多数基准测试中,参数仅为十分之一的LLaMA-13B的性能优于OpenAI推出的GPT3(175B),也即支持ChatGPT的GPT3.5的前身。 来源 , 来自:雷锋 频道:@kejiqu 群组:@kejiquchat 投稿:@kejiqubot

相关推荐

封面图片

Meta宣布推出大型语言模型LLaMA,加入到由微软、谷歌等科技巨头主导的AI“军备竞赛”中

Meta宣布推出大型语言模型LLaMA,加入到由微软、谷歌等科技巨头主导的AI“军备竞赛”中 当地时间2月24日,Meta宣布将推出针对研究社区的“Meta人工智能大型语言模型”系统(Large Language Model Meta AI),简称“LLaMA”。 同ChatGPT、New Bing不同,LLaMA并不是一个任何人都可以与之对话的产品,也并未接入任何Meta应用。更为确切地说,该产品将是一个开源的“研究工具”。 公司CEO扎克伯格在社交媒体上表示,LLaMA旨在帮助研究人员推进研究工作,LLM(大型语言模型)在文本生成、问题回答、书面材料总结,以及自动证明数学定理、预测蛋白质结构等更复杂的方面也有很大的发展前景。 标签: #Meta #ChatGPT #AI 频道: @GodlyNews1 投稿: @GodlyNewsBot

封面图片

Meta 确认其 Llama 3 开源大型语言模型将于下个月推出

Meta 确认其 Llama 3 开源大型语言模型将于下个月推出 在4月9日于伦敦举行的一次活动中,Meta 确认计划在下个月内首次发布 Llama 3,这是用于驱动生成式人工智能助手的下一代大型语言模型。Meta 全球事务总裁 Nick Clegg 说:“在接下来的一个月内,实际上更短,我们希望开始推出我们的新一代模型套件 Llama 3。”他的描述听起来像是要发布该产品的几个不同迭代或版本。“今年[发布]的不同版本,将有许多不同的模型具有不同的功能,而且很快就会开始。”Meta 首席产品官 Chris Cox 补充说,该计划将通过 Llama 3 为 Meta 的多种产品提供动力。

封面图片

OpenAI 即将发布一款全新的开源大型语言模型

OpenAI 即将发布一款全新的开源大型语言模型 The Information 引用了一位了解该计划的人士的话说,OpenAI 正面临着来自开源AI模型的激烈竞争,例如 Meta 的 LLaMA 与它的衍生模型,OpenAI 目前正准备向公众发布一款全新的开源语言模型。报告还称,OpenAI 不太可能发布与 GPT-4 和 GPT-3.5 竞争的模型。

封面图片

Meta 正开发更强大的新大型语言模型,对标OpenAI 的 GPT-4

Meta 正开发更强大的新大型语言模型,对标OpenAI 的 GPT-4 据知情人士透露,Meta 正在开发一款新的大型语言模型,并预计其功能将与 GPT-4 一样强大。根据 Meta 的目标,其新 AI 模型将比两个月前刚刚发布的名为 Llama 2 的模型强大数倍。这个新 AI 模型计划明年上线。 Meta 目前正在搭建这项工作所需的数据中心,并购置更多的 H100 芯片,这是英伟达用于此类 AI 训练的最先进制程芯片。其中一些知情人士说,虽然与微软合作在后者的云计算平台 Azure 上提供 Llama 2 服务,但 Meta 计划在自己的基础设施上训练这个新模型。

封面图片

Meta 推出 AI 编程工具 Code Llama,商业领域免费可用

Meta 推出 AI 编程工具 Code Llama,商业领域免费可用 Meta 现推出了一个名为的 AI 编码工具,号称“最先进的大型编码语言模型”。该模型基于 Llama 2 大型语言模型打造,可以理解为“Llama 2 的写代码专用版”,可用于“生成新的代码并调试人类编写的工作”,目前已上线 Github。 Meta 指出,Code Llama 能够根据代码核自然语言提示 / 要求生成你想要的代码和有关代码的自然语言,或者在指向特定代码时进行完善和调试。 除了基础版的 Code Llama 外,Meta 还推出了专为 Python 设计的版本 Code Llama-Python,以及一个能够理解自然语言指令的版本 Code Llama-Instrct。 据悉,Code Llama 将采用与 Llama 2 相同的社区许可,并对研究和商业领域免费开放。来源 , 频道:@kejiqu 群组:@kejiquchat 投稿:@kejiqubot

封面图片

Meta 新语言模型能运行在单张显卡上

Meta 新语言模型能运行在单张显卡上 Meta 上周宣布了一个新的大语言模型 LLaMA-13B,称其参数规模更小但性能强于 OpenAI 的 GPT-3 模型,且它能运行在单张显卡上。 语言模型的规模在从 70 亿到 650 亿参数,而 OpenAI GPT-3 模型有 1750 亿个参数。Meta 使用 Common Crawl、维基百科和 C4 等公开数据集训练其模型,它有可能公开其源代码和权重。今天绝大部分最先进的语言模型都没有公开源代码。Meta 称 LLaMA 为其基础模型,它将是未来该公司更先进模型的基础。它的 LLaMA-13B 模型在 BoolQ、PIQA、SIQA、HellaSwag、WinoGrande、ARC 和 OpenBookQA 等标准测试中的表现超过了 GPT-3。GPT-3 等衍生模型需要数据中心规模的计算能力进行处理,而 LLaMA-13B 能运行在单张显卡上,为在消费者硬件上实现类似 ChatGPT 的性能打开了大门。来源 , 来自:雷锋 频道:@kejiqu 群组:@kejiquchat 投稿:@kejiqubot

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人