OpenAI向左,Meta往右
OpenAI向左,Meta往右 与OpenAI拒绝Open他们的算法、路线、论文相反,Meta选择Open到底。此前震惊业内的大模型LLaMA,大获好评的LLaMA 2,以及正在研发的LLaMA 3,都是开源的。它们成为很多AI公司研究、学习甚至抄袭的对象。通过开源这一手段,Meta在某种程度上打破了大模型的垄断,成为OpenAI和Google双雄相争之外的第三股力量。一些人将扎克伯格视为大模型时代的英雄,有人在扎克伯格的帖子下留言,建议Meta更名为OpenAI,OpenAI更名为CloseAI。事实上,Meta过去开源了它研发的几乎所有基础设施,比如用于Web和APP开发框架的React,以及机器学习框架PyTorch,而ChatGPT就是基于PyTorch开发的,OpenAI也运行在PyTorch上。按照Meta首席科学家杨立昆的话说,除Google外,全世界都运行在PyTorch上,因为Google有自己的系统。只是,这些东西在过去都被Meta的负面新闻掩盖了干预选举进程、提供虚假信息、危害青少年健康,在硅谷,骂Facebook曾是一种“政治正确”, 人们认为这是一家价值观败坏的公司。如今风评大变,Meta一时仿佛成了整个AI圈的希望,它的股价在2023年上涨了160%,在美国前五大科技巨头中涨幅仅次于英伟达,最近重返万亿美元市值,股价创新高。而曾以挑战者姿态崛起的OpenAI,前不久刚经历了一场宫斗,散发出越来越浓的铜臭味。OpenAI向左,Meta往右,两家原本没有太多交集的公司,正走出截然不同的路。OpenAI,走向封闭在讨论这两家公司的境况之前,我们先把时间拉回到十年前。2013年,有一家叫DeepMind的AI公司,同时引起了Google和Facebook(当时还没更名为Meta)的注意。当时这家公司刚崭露头角,嗅觉敏锐的Google和Facebook都想收购它。最终,Google在竞购中胜出,2014年1月将DeepMind收入囊中。三年后,DeepMind开发的AI机器人AlphaGo,以4:1击败了韩国围棋冠军李世石,一举成名。Google收购DeepMind时,有两个人心里很不是滋味。一个是扎克伯格,他当时已经意识到AI的巨大前景;另一个是马斯克,他不想AI被Google这样的大公司控制。于是,扎克伯格决定自己做,他花重金从纽约大学请来了计算机科学领域的权威人物杨立昆,启动FAIR项目,在Facebook成立了AI实验室。马斯克则和奥尔特曼成立了OpenAI,用来对抗Google。从当时的情形来看,扎克伯格是为了自己的公司,马斯克是为了全人类。马斯克认为,由大公司控制的少量AI系统很不安全,唯一的办法是让尽可能多的人都拥有AI。所以OpenAI一开始就定位开源,是一个非营利性的机构。马斯克当时说:“我们希望有一种类似于Linux版本的AI,不受任何个人或公司的控制。”一个为私,一个为公,两家公司一开始就选了不同的路。马斯克提到的Linux,是一款免费开源的操作系统。在互联网早期,计算机刚开始普及时,可用的操作系统不多,要么源代码被软件厂商严格保密,要么收取很高昂的费用。一个欧洲大学生开发出Linux操作系统的雏形,然后免费对外公开了自己的代码。由于开源,全球程序员都加入进来改进代码,最终创造了Linux操作系统,且使用完全免费。这大大加速了计算机的普及。我们今天熟知的Android系统,就是基于Linux内核,全球大部分手机都跑在这个系统上。马斯克的想法很简单,AI时代也需要有这样一个开源开放的操作系统,市场不能让巨头独占。OpenAI的启动资金来源于一批科技大佬捐赠,它一开始的确是按开源的路径走的,2019年发布的GPT-2,就是一个开源大模型,当年还有人用GPT-2为《权利的游戏》改写剧本结尾。但也是在GPT-2发布之后,OpenAI逐渐走向封闭。它随后成立营利性子公司,接受了微软的数十亿美元投资。在那之后,2020年发布的GPT-3,2022年升级的GPT-3.5,以及2023年3月发布的GPT-4,都是闭源模型,一开始OpenAI还公布论文,到后来连模型具体参数都不再公布。而从整个大模型行业的竞争格局来看,“OpenAI-微软”“DeepMind-Google”的双巨头组合格局正式形成。马斯克对此非常不满。他说,OpenAI设立时是一家开源公司,现在变成了一个闭源、受微软控制的逐利公司。这根本不是他想要的。这期间Meta没闲着。除了折腾元宇宙,Meta的AI团队一直在研究大语言模型,并发布了一些开源项目。大家各做各的,互不干涉。在OpenAI发布ChatGPT的几周前,Meta发布了一个类似的聊天机器人Galactica,专门用于撰写科学论文。谁知道这个产品不仅没引起轰动,还招来一片骂声,网友痛斥它会破坏科学出版。以至于Meta的人取消了演示,觉都睡不着。当时人们关心的是Meta的元宇宙项目是不是快凉了,裁员裁到哪了,没人关心它的AI做得咋样。至于OpenAI,大家觉得它代表新势力,对它更加包容。按照杨立昆的说法,两周后ChatGPT问世,被视为救世主降临。随后的很长时间里,OpenAI都是全球科技界的当红炸子鸡,登上神坛夺走了所有目光。人们津津乐道于,OpenAI是如何冲破Google的封锁,对巨头形成压制。在崇尚个人英雄主义的美国,创业新秀挑战旧势力的剧本,向来充满话题性。于是大模型头部选手的竞争,变成了OpenAI和Google的双雄争霸。但一向好强的扎克伯格不会袖手旁观。Meta秘密研发的LLaMA大模型,已经箭在弦上。Meta才是全村的希望?2023年2月,ChatGPT发布之后3个月,LLaMA的第一个版本开源,一开始这个模型只能用作研究。7月,升级之后的LLaMA 2支持免费商用。Meta把模型训练数据、训练方法、数据标注等大量细节都公布了,起始代码全部开源。LLaMA 2性能非常突出,超过了所有的开源大模型。有人发现,其最大参数的版本比GPT-3参数量小,但效果更好。曾经跟着马斯克从OpenAI跳到特斯拉,后来又被OpenAI挖回去的科学家Andrej Karpathy,将LLaMA 2的发布视为人工智能和大模型发展过程中的重要一天,因为这“是任何人都可以拿到模型权重的最强大语言模型。”一时间,整个AI圈对Meta刮目相看。当一批巨头公司掀起大模型军备竞赛,试图通过技术封闭实现市场垄断时,Meta用LLaMA撕开了一条口子。OpenAI没做的事,Meta做到了。英诺天使基金合伙人王晟戏称杨立昆为“Klaus LeCun”( 杨立昆英文名为Yann LeCun,Klaus Fuchs在二战期间向苏联提供了曼哈顿计划的信息)。王晟开玩笑:“不能只让美国拥有原子弹。”王晟发现,ChatGPT出现之后,科技圈对大模型热情且迷茫。投资人中很多是看热闹,“因为第一看不懂,第二不敢投,第三投不到。一个新的技术范式出现,没人知道它的能力边界在哪里。”王晟对“定焦”说,LLaMA开源对行业影响很大。“Meta过去这些年积累的大模型技术,本来都是不传之秘,结果一开源,迅速把很多认知拉平了。”之前,国内团队研发大模型,只能从零到一不断试错,一旦有个点被卡住了,即便从技术角度来说并不是太难,但靠自己可能也需要花一两年时间才能解决,需要亲自踩很多坑。现在Meta直接把它的经验和数据拿出来,在思路和方法上给了行业非常重要的指引。“在这个过程中大家学习了很多。假如没有LLAMA开源,国内大模型今天的水平可能会差很多,我们会大幅度被人甩下。”王晟说。这也是为什么国内一下子突然涌现出200多个大模型。王小川的百川智能在公司成立仅两个月就发布了一款大模型,其实就是借鉴了LLaMA。李开复的零一万物推出的大模型,也是使用LLaMA的开源模型架构。LLaMA开源对OpenAI最直观的影响,是有一堆中国公司跳出来“吊打”GPT。在他们的口径中,已经在多项指标上超过了GPT模型,虽然很多榜单都是刷出来的。更深层次的影响在于,大模型开源社区的力量快速壮大,全球的程序... PC版: 手机版:
在Telegram中查看相关推荐

🔍 发送关键词来寻找群组、频道或视频。
启动SOSO机器人