免费还能干翻GPT-4 Meta打了所有闭源大厂的脸

免费还能干翻GPT-4Meta打了所有闭源大厂的脸就在今天凌晨,Meta正式发布了全新的Llama3模型,还一次上新了8B和70B两个参数版本。它的训练数据集比Llama2整整大了7倍,达到了15T,容量也是上一代的两倍,支持8K上下文长度。目前,它们已经接入了Meta最新发布的智能助手MetaAI中,所有人都可以免费使用。这两个模型同样全面开源,开发者可以免费下载,并且用于商用。(不过要注意的是,如果MAU超过7亿,你得申请特殊商业许可)小扎这是誓死要在开源这条路上,一条道走到黑了。当然更炸裂的是Llama3的实力除了稳居开源大模型榜首外,甚至还能在一定程度上,薄纱GeminiPro1.5、Claude3Sonnet等处于第一梯队的闭源大模型。有网友更新了一份现有大模型的能力和参数对应表,能看到Llama3的两个模型的表现都相当亮眼。这,可以说是给大模型的开源派大涨了一波士气。反正消息一出炉,开源社区立马就沸腾了,各种梗图满天飞,感谢着小扎又带兄弟们冲了一次。不过,世超觉得既然模型已经上线了,看再多的技术细节和跑分数据,都不如咱们亲自上手试试。稍微有些可惜的是,目前发出的这两个版本,还没有办法支持中文输出。也暂时只有文字对话和画图这两个简单的功能。在各家多模态打磨得出神入化的现在,多少有点OUT了。不过好在这次Meta的图片输出,有一个挺新奇的功能。我们在聊天框里输入文字,不需要发送,Llama3就会实时根据内容生成图像。比如我分几次在对话框输入了【一只猫在睡觉、跳舞和跳跃】,就能看到屏幕上生成的图片内容在跟着实时变化。到了文字输出这边,惊喜度就不高了。既然它在测试中,说自己在编程、多选题等等方面,都赶超Claude3的中型版本,咱也着重测了测这方面的虚实。世超测了很多题,这里就只放出两边有差别的地方。比如简单的逻辑推理:我今天有3个苹果,昨天吃了一个,今天还剩几个?Llama3完全没有压力,轻松驾驭。但同样的题抛给Claude3,却被完全绕进去了。不过,后面世超后面简单测了几道代码能力,反而Claude3的表现更让人惊艳。世超要求Llama3给我做两个简单的html小游戏。结果,做出的贪吃蛇和打砖块游戏,都没有办法正常运行。游戏还没有开始,就显示GameOver了。但Claude3这边做的,虽说有点小瑕疵,游戏重新开始之后,分数不会刷新。但除此之外都很完美,游戏能有正常运行。而且生成速度巨快,几秒钟就做出来。上一次见到这个速度的,还是GPT-4。而在后面的开放题,Llama3则又马上扳回了一城。世超给了一个开放性的问题:类人机器人的未来会是什么样子?几个字的小问题,Llama3按照短期、中期和远期,三个阶段来分点构思了一下可能性。由于篇幅限制,这里只截取了短期Claude3这边就有些中规中矩了,跟上面分时间、分点罗列的优等生比,逊色不少。整体测试下来,Llama3和闭源的Claude3基本打得有来有回,甚至一些方面小胜。但如果只能做到这个程度,Meta这次更新根本没法在圈子里掀起这么大风浪。这俩模型并不是重头戏,真正牛叉的地方,是官网里提到的一个信息:400B+参数级的Llama3正在训练准备中了。从纸面的各项数据上看,它各方面都强得可怕。Llama的产品副总裁RagavanSrinivasan在一次采访中说,这个版本可以媲美同类的一流专业模型。不仅做到媲美,很多功能表现,还要强过Claude3的超大杯版本和GPT-4。虽说Meta认为还要评估一下安全性,再决定开不开源,但消息一出,业内早已经开始狂欢了。因为开源社区的人,或许不用等着OpenAI重拾初心,就能到调教、魔改上GPT-4级别的模型了。英伟达科学家直接就发文说,小扎这个400B+的模型,将会是行业的一个分水岭,会改变很多公司和研究的未来。刚好今天过生日的前百度首席科学家、Google大脑之父吴恩达,也说Meta这次更新,是他有史以来收到过最好的生日礼物。可想而知,Llama3给行业带来的震撼。目前,这个400B+的终极版本预计将会在夏天发布。OpenAI再不发力,Llama3为代表的开源大模型,彻底超车闭源大模型的历史时刻,可能真的就要来临了。而早在Llama3发布之前,大模型是开源牛,还是闭源好的问题,其实早就吵得不可开交了。两边阵营都不缺大佬,李彦宏所说的,“开源模型会越来越落后”,世超觉得逻辑上是很自洽的。因为闭源公司有成熟的商业模式,有更多的资金和人力砸进去搞研究,自己辛苦研发的成果,也可以得到保护。简而言之就是能赚钱,能赚钱才能聚集算力、聚集人才。反观很多开源模型,不仅商业模式还在探索中,有的也都是零零散散的小规模产品。月之暗面的杨植麟就曾发表过类似的观点,说是大部分基于开源大模型的应用,没有经过大算力的验证,它们在性能的稳定性、未来的可扩展性都不好说。而支持开源的这一派,世超同样也觉得不无道理。朱啸虎曾经表达过一个看法,闭源现在确实领先于开源,但开源模型最终会追上。“OpenAI就一两百个工程师,开源的全世界几百万、几千万工程师在用,怎么可能一直比非开源的落后?”开源社区用了一年时间,就超过了GPT-3.5,现在已经来到GPT-4水平。而现在Llama3等模型的大力赶超,正在不断验证这句话。比尔盖茨早年间,曾经公开吐槽过Linux系统。觉得它从商业上来看根本不可行,既不能保护自己的知识产权,又没法赚取收入来搞研发,最多就是个半吊子。《乔布斯传》中也提到过,乔布斯也怒喷过隔壁Android就是shit,认为它的开源给它带来各种麻烦。最后这俩超级大佬都被打脸了……甚至比尔盖茨后来公开承认微软在偷学Linux,Android也丝毫不比iOS差。而世超觉得,很可能大模型的开源闭源之间,根本就不是你死我活、不是谁强谁就一定弱。就比如Google,基本就是两手抓,既有闭源的Gemini,也有开源的Gemma。曾靠开源出圈的Mistral在拿了微软投资之后,它的MistralLarge也不再对外开源。所以开源和闭源很可能只是路线之别,哪有啥对错,只是有合适与否。而唯一能确定就是,甭管你是开源还是闭源,烧钱都是逃不开的,无论是OpenAI背后的微软,还是Llama背后的Meta,亦或是国内的BAT,大模型的战场还是这帮顶级资本之间的斗争。咱们就搬好小板凳,磕着瓜子继续吃瓜吧。...PC版:https://www.cnbeta.com.tw/articles/soft/1427975.htm手机版:https://m.cnbeta.com.tw/view/1427975.htm

相关推荐

封面图片

周鸿祎:我不是针对李彦宏 开源一定会超过闭源

周鸿祎:我不是针对李彦宏开源一定会超过闭源据了解,第二十七届哈佛中国论坛上,周鸿祎发表演讲称:“我是一直相信开源的力量,至于说网上有些名人胡说八道,你们别被忽悠了。他说开源不如闭源好?连说这话的公司自己都是借助了开源的力量才成长到今天。”随后,4月16日举行的Create2024百度AI开发者大会上,李彦宏在演讲中宣称,“开源模型会越来越落后”。周鸿祎还表示,开源一定会超过闭源,Llama已经给出了最好的答案。“昨天半夜,Meta开源了Llama3一个80亿版本,一个700亿版本,性能都很强,超过了谷歌闭源的Gemini。据说还有一个4000亿参数的版本在路上,性能应该会超越GPT-4。开源到底行不行,Llama已经给了最好的答案。”在周鸿祎看来,开源对整个互联网的发展、对大模型的发展都意义重大。如果没有开源,只靠一两家闭源公司,人工智能的发展不会有今天这么快。特别是对我们国家来说,我们在人工智能的核心算法、核心技术上比美国要落后一些时间,所以我们更要善于参与开源、利用开源,通过开源来学习,快速提高人工智能的核心能力。周鸿祎还强调,其实开源和闭源是两种不同的商业模式,没有必要相互贬低。安卓和iOS,Linux和Windows都是一个开源一个闭源,也都活得很好。...PC版:https://www.cnbeta.com.tw/articles/soft/1428033.htm手机版:https://m.cnbeta.com.tw/view/1428033.htm

封面图片

傅盛评阿里云 “最强开源模型”:长远看来,开源大模型能力会超越闭源

傅盛评阿里云“最强开源模型”:长远看来,开源大模型能力会超越闭源近日,阿里云发布开源模型Qwen2-72B。据介绍,该模型性能超过美国最强的开源模型Llama3-70B,也超过众多国内闭源大模型。对此,猎豹移动董事长兼CEO、猎户星空董事长傅盛发视频表示,正当国内某大厂CEO说闭源模型的能力将持续超越开源模型时,阿里巴巴刚发布的Qwen2-72B开源模型能力已经超越了国内绝大多数闭源模型。“我们之前一直认为开源大模型和闭源大模型会并驾齐驱,而且长远看来,我认为开源社区的大模型能力会超越闭源,这背后的原因就是开源并不是简单的做雷锋,而是结合自己的商业模式,结合能够形成社区的反馈能力的一套战略部署。”(新浪科技)

封面图片

Meta 发布 Llama 3 开源模型

Meta发布Llama3开源模型Meta发布了其Llama系列开源生成式AI模型的最新成员:Llama3。该公司已经开源了其新Llama3系列中的两种模型,其余模型将在未指定的未来日期推出。Meta称,新模型Llama38B和Llama370B与上一代Llama模型Llama28B和Llama270B相比,在性能方面实现了“重大飞跃”,是目前性能最好的生成式AI模型之一。——

封面图片

因赛集团:是否与 Kimi 等国内闭源语言大模型深入合作尚需论证

因赛集团:是否与Kimi等国内闭源语言大模型深入合作尚需论证针对公司与月之暗面Kimi大模型是否有合作的问题,因赛集团在互动平台表示,InsightGPT是借鉴了多种开源大模型或算法、Paper以及自有行业数据和业务方法论进行融合并持续训练而成的营销行业多模态垂类模型,同时也会调用几个闭源大模型。月之暗面Kimi目前是公司调用的闭源大模型之一,其主要优势在于高效处理长文本的能力。经公司初步评测,其中文处理能力接近ChatGPT4Turbo。由于预计短期内Llama3、Grok等海外通用开源语言大模型在技术、资金等层面将持续领先于国内大模型,以及InsightGPT优先选择开源大模型与自有行业数据结合进行训练,是否与Kimi等国内闭源语言大模型尝试深入合作尚需详细论证。

封面图片

国泰君安:大模型开源路线得到确认,AI 应用场景创新迎来催化

国泰君安:大模型开源路线得到确认,AI应用场景创新迎来催化国泰君安研报表示,Meta推出其最新版本的人工智能开源大语言模型Llama3,包括8B和70B参数的两个版本,多项关键基准测试的表现优于诸多同类模型。随着未来400B参数的大版本模型Llama3的推出,开源社区有望迎来巨大变革,AI创新应用有望加速落地。当前大模型技术路线存在OpenAI为代表的闭源阵营和Llama为代表的开源阵营,此次Llama3在模型参数较小的情况下还能实现性能的显著优势,进一步肯定了开源的技术路线和Llama的训练框架。模型使用效率的提升也将调动周边的工具类应用,AI应用场景创新有望取得进一步突破。

封面图片

uckDuckGo AI Chat

网站名称:DuckDuckGoAIChat网站功能:AI聊天网站简介:DuckDuckGo提供的匿名访问的AI模型。包括GPT-3.5、Claude3、开源的Llama3和Mixtral3。用户的聊天内容不会被用于AI训练。可以选择不同的AI模型进行聊天,每个模型的响应不同。提供的模型包括OpenAI的GPT-3.5Turbo、Anthropic的Claude3Haiku、MetaLlama3和MistralAI的Mixtral8x7B。网站链接:

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人