Meta称其LLaMA语言模型比OpenAI的GPT-3更有前景

Meta称其LLaMA语言模型比OpenAI的GPT-3更有前景LLaMA有多种尺寸,从70亿个参数到650亿个参数不等。Meta方面称,尽管LLaMA-13B的尺寸较小,而且少了1620亿个参数,但“在大多数基准测试中”表现优于OpenAI的GPT-3。据报道,最大的模型LLaMA-65B与DeepMind的Chinchilla70B和PaLM-540B等模型可相提并论。LLaMA是一个基础模型:它在大量未标记数据上进行训练,这使得研究人员更容易针对特定任务微调模型。由于模型更小,因此更容易针对用例进行再训练。LLaMA不仅仅是使用英语文本构建的。Meta使用20种使用拉丁语或西里尔语脚本的语言训练其模型。然而,大多数训练数据都是英语,因此模型性能更好。Meta的研究人员声称,由于模型的大小,对当前大型语言模型的访问受到限制。Meta认为“这种受限访问限制了研究人员理解这些大型语言模型如何工作以及为何工作的能力,阻碍了提高其稳健性和解决已知问题(例如偏见、侮辱和产生错误信息的可能性)的努力”。除了使模型更小之外,Meta还试图让LLaMA更易于访问,包括在非商业许可下发布它。对各种LLaMA模型的访问权限只会根据具体情况授予学术研究人员,例如隶属于政府、民间组织和学术界的研究人员。与ChatGPT一样,LLaMA与其他语言模型一样存在生成有偏见或不准确的信息。Meta的LLaMA声明承认了这一点,并表示通过共享模型,研究人员可以“更轻松地测试新方法来限制或消除大型语言模型中的这些问题。”Meta在去年5月曾推出一款面向研究人员的名为OPT-175B的大型语言模型,去年年底还发布过另一款模型Galactica,但后者被发现经常分享有偏见或不准确的信息,在48小时内被迅速下架。...PC版:https://www.cnbeta.com.tw/articles/soft/1346899.htm手机版:https://m.cnbeta.com.tw/view/1346899.htm

相关推荐

封面图片

Meta发布全新大型语言模型LLaMA,加入硅谷AI竞赛

Meta发布全新大型语言模型LLaMA,加入硅谷AI竞赛当地时间2月24日,Meta公司发布一款新的人工智能大型语言模型LLaMA,加入微软、谷歌等硅谷公司的竞赛。Meta首席执行官扎克伯格在Instagram表示,LLaMA模型旨在帮助研究人员推进工作,在生成文本、对话、总结书面材料、证明数学定理或预测蛋白质结构等更复杂的任务方面“有很大的前景”。Meta表示,在大多数基准测试中,参数仅为十分之一的LLaMA-13B的性能优于OpenAI推出的GPT3(175B),也即支持ChatGPT的GPT3.5的前身。来源,来自:雷锋频道:@kejiqu群组:@kejiquchat投稿:@kejiqubot

封面图片

【Meta和Microsoft联手推出开源大型语言模型Llama 2】

【Meta和Microsoft联手推出开源大型语言模型Llama2】2023年07月19日10点52分7月19日消息,Meta和Microsoft联手推出开源大型语言模型Llama2,将在Microsoft的Windows和云计算平台Azure上运行。Llama2免费用于研究和商业用途,同时还针对在Windows上运行进行了优化。Meta称Llama2接受的公开在线数据源的训练量比Llama1多40%,处理的上下文量是Llama1的两倍。

封面图片

Meta推出先进大型语言模型 下一个ChatGPT不远了?

Meta推出先进大型语言模型下一个ChatGPT不远了?同ChatGPT、NewBing不同,LLaMA并不是一个任何人都可以与之对话的产品,也并未接入任何Meta应用。更为确切地说,该产品将是一个开源的“研究工具”。公司CEO扎克伯格在社交媒体上表示,LLaMA旨在帮助研究人员推进研究工作,LLM(大型语言模型)在文本生成、问题回答、书面材料总结,以及自动证明数学定理、预测蛋白质结构等更复杂的方面也有很大的发展前景。1、开源的“研究工具”Meta表示,LLaMA可以在非商业许可下提供给政府、社区和学术界的研究人员和实体工作者,正在接受研究人员的申请。此外,LLaMA将提供底层代码供用户使用,因此用户可以自行调整模型,并将其用于与研究相关的用例。与之截然不同的是,Google旗下的DeepMind和OpenAI并不公开训练代码。该公司还表示,LLaMA作为一个基础模型被设计成多功能的,可以应用于许多不同的用例,而不是为特定任务设计的微调模型。2、比GPT3.5性能更强根据Meta官网介绍,LLaMA包含4个基础模型,参数分别为70亿、130亿、330亿和650亿。其中,LLaMA65B和LLaMA33B在1.4万亿个tokens上训练,而最小的模型LLaMA7B也经过了1万亿个tokens的训练。Meta表示,在大多数基准测试中,参数小的多的LLaMA-13B的性能优于GPT3.5的前身GPT3-175B,而LLaMA-65B更可与业内最佳的Chinchilla-70B和PaLM-540B竞争。值得一提的是,近期大火的ChatGPT便是由GPT3.5提供支持。Meta还提及,LLaMA-13B对算力的要求“低得多”,可以在单个数据中心级GPU(NVIDIATeslaV100)上运行。扎克伯格写道:“Meta致力于这种开放的研究模式,我们将向AI研究社区提供我们的新模型。”值得一提的是,去年5月,Meta也曾推出过大型语言模型OPT-175B。该项目同样也是针对研究人员的,这构成了其聊天机器人blenterbot新迭代的基础。后来,该公司还推出了一款名为“卡拉狄加”(Galactica)的模型,但因经常分享偏见和不准确的信息而遭到下架。据媒体报道,扎克伯格已将人工智能作为公司内部的首要任务,其本人也经常在财报电话会议和采访中谈论它对改进Meta产品的重要性。媒体分析称,虽然现在LLaMA没有在Meta产品中使用,但未来不排除使用的可能。...PC版:https://www.cnbeta.com.tw/articles/soft/1346389.htm手机版:https://m.cnbeta.com.tw/view/1346389.htm

封面图片

Meta官宣深入AI大战 推出先进大型语言模型

Meta官宣深入AI大战推出先进大型语言模型扎克伯格在社交媒体上称,FacebookAIResearch研发的LLaMA是“目前水平最高的”大型语言模型,目标是帮助研究人员推进他们在人工智能(AI)领域的工作。“大型语言模型”(LLM)可以消化大量的文本数据,并推断文本的单词之间的关系。随着计算能力的进步,以及输入数据集与参数空间的不断扩大,LLM的能力也相应提高。目前,LLM已经被证明能高效地执行多种任务,包括文本生成、问题回答、书面材料总结等。扎克伯格称,LLM在自动证明数学定理、预测蛋白质结构等更复杂的方面也有很大的发展前景。值得一提的是,近期大火的ChatGPT就是采用LLM构建的聊天机器人。ChatGPT由GPT3.5提供支持,而GPT3.5是一款基于OpenAI175B参数基础模型训练的LLM,175B是它从训练数据中所学习、沉淀下来的内容。Meta在官网介绍中称,LLaMA有7B、13B、33B和65B四个基础模型,在大多数基准测试中都优于GPT3.5的前身GPT3-175B,而LLaMA-65B可与业内最佳的Chinchilla-70B和PaLM-540B竞争。Meta还宣布,将针对学术研究者共享其模型,正在接受研究人员的申请。与之截然不同的是,Google旗下的DeepMind和OpenAI并不公开训练代码。根据2021年媒体的一份调查显示,AI专家们通常将DeepMind、OpenAI和FAIR(FacebookAIResearch)视为该领域的“前三甲”。去年年底,Meta发布了另一款名为Galactica的模型,但因经常分享偏见和不准确的信息而遭到下架。...PC版:https://www.cnbeta.com.tw/articles/soft/1346305.htm手机版:https://m.cnbeta.com.tw/view/1346305.htm

封面图片

Meta 正开发更强大的新大型语言模型,对标OpenAI 的 GPT-4

Meta正开发更强大的新大型语言模型,对标OpenAI的GPT-4据知情人士透露,Meta正在开发一款新的大型语言模型,并预计其功能将与GPT-4一样强大。根据Meta的目标,其新AI模型将比两个月前刚刚发布的名为Llama2的模型强大数倍。这个新AI模型计划明年上线。Meta目前正在搭建这项工作所需的数据中心,并购置更多的H100芯片,这是英伟达用于此类AI训练的最先进制程芯片。其中一些知情人士说,虽然与微软合作在后者的云计算平台Azure上提供Llama2服务,但Meta计划在自己的基础设施上训练这个新模型。——

封面图片

Meta 确认其 Llama 3 开源大型语言模型将于下个月推出

Meta确认其Llama3开源大型语言模型将于下个月推出在4月9日于伦敦举行的一次活动中,Meta确认计划在下个月内首次发布Llama3,这是用于驱动生成式人工智能助手的下一代大型语言模型。Meta全球事务总裁NickClegg说:“在接下来的一个月内,实际上更短,我们希望开始推出我们的新一代模型套件Llama3。”他的描述听起来像是要发布该产品的几个不同迭代或版本。“今年[发布]的不同版本,将有许多不同的模型具有不同的功能,而且很快就会开始。”Meta首席产品官ChrisCox补充说,该计划将通过Llama3为Meta的多种产品提供动力。——

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人