ℹ三星松了口气？ChatGPT提供「不学习」聊天历史选项#这也的确让ChatGPT这样的爆红的生成式AI大型语言模型技术，探索出

Meta推出先进大型语言模型下一个ChatGPT不远了？

Meta推出先进大型语言模型下一个ChatGPT不远了？同ChatGPT、NewBing不同，LLaMA并不是一个任何人都可以与之对话的产品，也并未接入任何Meta应用。更为确切地说，该产品将是一个开源的“研究工具”。公司CEO扎克伯格在社交媒体上表示，LLaMA旨在帮助研究人员推进研究工作，LLM（大型语言模型）在文本生成、问题回答、书面材料总结，以及自动证明数学定理、预测蛋白质结构等更复杂的方面也有很大的发展前景。1、开源的“研究工具”Meta表示，LLaMA可以在非商业许可下提供给政府、社区和学术界的研究人员和实体工作者，正在接受研究人员的申请。此外，LLaMA将提供底层代码供用户使用，因此用户可以自行调整模型，并将其用于与研究相关的用例。与之截然不同的是，Google旗下的DeepMind和OpenAI并不公开训练代码。该公司还表示，LLaMA作为一个基础模型被设计成多功能的，可以应用于许多不同的用例，而不是为特定任务设计的微调模型。2、比GPT3.5性能更强根据Meta官网介绍，LLaMA包含4个基础模型，参数分别为70亿、130亿、330亿和650亿。其中，LLaMA65B和LLaMA33B在1.4万亿个tokens上训练，而最小的模型LLaMA7B也经过了1万亿个tokens的训练。Meta表示，在大多数基准测试中，参数小的多的LLaMA-13B的性能优于GPT3.5的前身GPT3-175B，而LLaMA-65B更可与业内最佳的Chinchilla-70B和PaLM-540B竞争。值得一提的是，近期大火的ChatGPT便是由GPT3.5提供支持。Meta还提及，LLaMA-13B对算力的要求“低得多”，可以在单个数据中心级GPU（NVIDIATeslaV100）上运行。扎克伯格写道：“Meta致力于这种开放的研究模式，我们将向AI研究社区提供我们的新模型。”值得一提的是，去年5月，Meta也曾推出过大型语言模型OPT-175B。该项目同样也是针对研究人员的，这构成了其聊天机器人blenterbot新迭代的基础。后来，该公司还推出了一款名为“卡拉狄加”（Galactica）的模型，但因经常分享偏见和不准确的信息而遭到下架。据媒体报道，扎克伯格已将人工智能作为公司内部的首要任务，其本人也经常在财报电话会议和采访中谈论它对改进Meta产品的重要性。媒体分析称，虽然现在LLaMA没有在Meta产品中使用，但未来不排除使用的可能。...PC版：https://www.cnbeta.com.tw/articles/soft/1346389.htm手机版：https://m.cnbeta.com.tw/view/1346389.htm

ℹ三星松了口气？ChatGPT提供「不学习」聊天历史选项#这也的确让ChatGPT这样的爆红的生成式AI大型语言模型技术，探索出

相关推荐

Meta推出先进大型语言模型下一个ChatGPT不远了？

ChatGPT/Claude/Cohere等大型语言模型(LLM)的实际效果对比试炼场

用大型语言模型理解HTML

ℹ为什么用ChatGPT帮你写报告是不值得的冒险？#ChatGPT是OpenAI最新且最重要的大型语言模型（LLM），在自然语言

一位论文作者火了，ChatGPT等大型语言模型何时能成为论文合著者？#抽屉IT

面向音乐信息检索的大型语言模型教程

相关推荐

Meta推出先进大型语言模型 下一个ChatGPT不远了？

ChatGPT/Claude/Cohere等大型语言模型(LLM)的实际效果对比试炼场

用大型语言模型理解HTML

ℹ为什么用ChatGPT帮你写报告是不值得的冒险？#ChatGPT是OpenAI最新且最重要的大型语言模型（LLM），在自然语言

一位论文作者火了，ChatGPT等大型语言模型何时能成为论文合著者？#抽屉IT

面向音乐信息检索的大型语言模型教程

Meta推出先进大型语言模型下一个ChatGPT不远了？