英伟达正在“垄断”AI产业,国内厂商准备好了吗?

英伟达正在“垄断”AI产业,国内厂商准备好了吗?与其一同前往的还有特斯拉和OpenAI的创始人,埃隆马斯克。这次OpenAI之行,老黄不为别的,就是为了把这台刚出炉的超算送给OpenAI,给他们的人工智能项目研究加一波速。这台DGX-1价值超过百万,是英伟达超过3000名员工,花费三年时间打造。这台DGX-1,能把OpenAI一年的训练时间,压缩到短短一个月。而这,是他对人工智能未来的豪赌,加的一波注。七年之后,在前不久的GTC大会上,老黄穿着皮衣,拿着芯片,整个宣讲不离AI。似乎是在告诉各位,AI的时代,我英伟达,就要称王了,当年的豪赌,他赢了!这么说吧,在去年经历一波矿难之后,不少人都以为曾靠着矿潮狂赚一笔的英伟达,会在矿难之下市值暴跌,一蹶不振。但实际情况却有点微妙……英伟达的股价在跌了大半年之后,从十月份开始,一路上涨,到现在,整个英伟达市值已经涨回到了6500亿美元,是AMD的4倍,英特尔的6倍。瞧瞧,这还是当年那个求着各位买显卡的老黄嘛?而让英伟达的股价疯涨的,那便是他们从十多年前就开始押注的AI计算。给大家一个数据,从15年后,英伟达的GPU在超算中心的市场份额就一路上涨,这几年稳居90%左右。在独立GPU市场上,英伟达的市场占有率也一度超过80%。另外,包括YouTube、CatFinder、AlphaGo、GPT-3、GPT-4在内,AI历史上那些叫得出名的玩意,几乎都是在英伟达的硬件上整出来的。英伟达的硬件,仿佛就是新时代的内燃机,载着AI时代不断前进。差友们可能会有点疑问,为什么在AI爆发的时代,好像就只有老黄有好处,其它的显卡生产商们的显卡不能训练AI嘛?能训练,但只能训练一点点。为啥?这就不得不提到英伟达从2006年就开始着手开发一个东西——CUDA(统一计算设备架构)。差评君简单解释一下它是干嘛的,当你想要计算一些比较庞大的运算问题时,通过CUDA编程,你就能充分利用GPU的并行处理能力,从而大幅提升计算性能。差评君说一个听来的比喻。CPU就好比是个数学教授,GPU就是100个小学生,放一道高数题下来那100个小学生可能会懵逼;但是放100道四则口算题下来,那100个小学生同时做肯定比数学教授快多了。深度学习就是上面的例子中那100道口算题,那个让GPU处理器并行运算的“工具”就叫CUDA。一般来说,使用CUDA和不使用CUDA,两者在计算速度上往往有数倍到数十倍的差距。既然CUDA这么有用,为什么其它的GPU厂商不去搞个竞品呢?不是不去搞啊,而是他们真的没想到!在早期,GPU的作用只是为了加速图形渲染,各大厂商们认为它就是一个图形专用计算芯片,并没有想到把GPU用在其它通用计算方面。至于拿来做深度学习?以那个年代的AI能力,一是没有太大的必要,二是也没有人觉得它有用。英伟达深度学习团队的布莱恩在聊到CUDA时这么说道:“在CUDA推出十年以来,整个华尔街一直在问英伟达,为什么你们做了这项投入,却没有人使用它?他们对我们的市值估值为0美元。”不过说没人用也是过于严重了。其实早在2012年,多伦多大学的AlexKrizhevsky就在ImageNet计算机视觉挑战赛中,利用GPU驱动的深度学习击败了其它对手,当时他们使用的显卡是GTX580。在这之后又经过了4年,那些搞深度学习的人才突然意识到,GPU的这种设计结构方式,在训练AI的速度上,真的是CPU不能比的。而拥有了CUDA原生支持的英伟达GPU,更是首要之选。到现在,资本们已经看到了AI的重要之处,为什么大家都还在卷AI模型,而不去卷老黄的市场呢?原因在于,它们已经很难再拿到AI加速芯片的入场券了。在人工智能产业上,整个深度学习的框架已经是老黄的形状了。AI发展的数十年间,英伟达通过对CUDA开发和社区的持续投入,CUDA和各类AI框架深度绑定。当今使用排行靠前的各类AI框架,就没有不支持CUDA的,也就是说你想要让你的深度学习跑的快?买张支持CUDA的高性能卡是最好的选择,说人话就是——买N卡吧。当然,在CUDA大力发展期间,也有其它公司在尝试着打破英伟达这种接近垄断的局面。2008苹果就提过出OpenCL规范,这是一个统一的开放API,旨在为各种不同的GPU型号提供一个规范,用以开发类似CUDA的通用计算软件框架。但是,通用就意味着不一定好用。因为各大厂商GPU的型号繁而复杂,为了适应各种硬件,驱动版本也多如牛毛,质量参差不齐。而且缺少对应的厂商进行针对性的优化,所以,无论是哪一个版本的OpenCL,在同等算力下,都比不过使用CUDA的速度。而且恰恰是因为OpenCL的通用性,想要开发支持OpenCL的框架,要比开发CUDA的复杂不少。原因还是同一个,缺少官方的支持,看看英伟达对CUDA开发的工具支持吧,CUDAToolkit,NVIDIAGPUComputingSDK以及NSight等等。OpenCL这边,就略显寒酸了……这就导致如今能支持OpenCL的深度学习框架寥寥无几。举个很简单的例子,当下最火的框架PyTorch,就连官方都没有专门对OpenCL进行支持,还得靠着第三方开源项目才能用。那同为显卡供应商的AMD,在面对老黄如日中天的CUDA时,除了OpenCL,有没有自己的解决办法呢?方法确实是有,但效果也确实不咋的。2016年AMD发布了全新的开放计算平台——ROCm,对标的就是英伟达的CUDA,最关键的一点是,它还在源码级别上对CUDA程序进行支持。你看,就算是老黄的死对头AMD,想的也不是另起炉灶,而是降低自己适配CUDA的门槛……但是,时至今日,ROCm依然还是只支持Linux平台,可能也是用的人太少了,有点摆烂的味道,毕竟,既然你支持CUDA,那我为什么要费尽心力去给你的ROCm专门编写一套支持框架呢?同年,Google也有了行动,但毕竟不是芯片制造商,Google只是推出了自己的TPU平台,专门针对自家的TensorFlow框架进行优化,当然原生支持的最好的也只有TensorFlow了。至于英特尔那边,也推出了一个OneAPI,对标老黄的CUDA,不过由于起步较晚,现在还处于发展生态的环节,未来会怎样还不太好说。所以靠着先发优势还有原生支持,导致现在的深度学习,基本上离不开英伟达的GPU和他的CUDA。最近大火的ChatGPT,就用了老黄的HGX主板和A100芯片,而老黄对此也是很有自信的说道:“现在唯一可以实际处理ChatGPT的GPU,那就只有我们家的HGXA100。”没错,没有其它可用的了,这就是老黄的有恃无恐。而随着OpenAI对大模型AI的成功验证,各家巨头对大模型AI的纷纷入局,英伟达的卡已经立马成了抢手货。所以如今的AI创业公司,出现了一件很有意思的现象,在他们的项目报告上,往往会搭上一句我们拥有多少块英伟达的A100。当大家在AI行业纷纷投资淘金时,英伟达就这样靠着给大家卖水——提供AI加速卡,大赚特赚,关键还在于,只有它卖的水能解渴。因为它的硬件以及工具集,已经能影响到整个AI产业的战局和发展速度了。更可怕的是,英伟达的优势已经形成了一种壁垒,这壁垒厚到就连全球第二大GPU厂商AMD都没有办法击穿。所以在AI大浪滔天的现在,能整出属于自己的AI大模型固然重要,但差评君却觉得,啥时候能有自己的英伟达和CUDA也同样不可小觑。当然,这条路也更难。最后,差评君觉得在未来,我们需要抓紧突破的,绝对不只是对人工智能大模型相关的研究,更为重要的是整个计算芯片的设计,制造,以及AI生态的建设。新的工业革命已经到来,A...PC版:https://www.cnbeta.com.tw/articles/soft/1352789.htm手机版:https://m.cnbeta.com.tw/view/1352789.htm

相关推荐

封面图片

从亏钱生意到利润1000% 英伟达靠什么成为万亿GPU霸主?

从亏钱生意到利润1000%英伟达靠什么成为万亿GPU霸主?GPU芯片在超级计算和全球巨头大模型训练战中地位举足轻重,而掌握全球80%GPU市场份额的英伟达赚得盆满钵满。然而,这种垄断式的市场占有率不是一夜砌成的“城墙”。据Tractica数据,预计到2025年全球AI硬件市场收入将达到2349亿美元,其中GPU的收入占23.2%。英伟达在GPU市场的构筑的护城河,CUDA是其中至关重要的一环。一套完善的编译器生态2006年,正是在AMD收购了ATI、英特尔依然蝉联全球第一大芯片厂商的时候,英伟达推出了CUDA(ComputeUnifiedDeviceArchitecture),它是英伟达研发的平行运算平台及编程模型。AI大神吴恩达简单评价了CUDA的意义:“在CUDA出现之前,全球能用GPU编程的可能不超过100人,有CUDA之后使用GPU就变成一件非常轻松的事。”多数CUDA的推荐者认为,CUDA完善的编译器生态是英伟达GPU在高性能计算领域成功的关键。具体来讲,CUDA具有易部署、开发接口灵活、编程语言适配、工具及代码库完备等优点,并且兼容Windows、Linux和MacOS多个操作系统。CUDA的开发让GPU不再是简单的图形处理器,适用对象也从游戏制作人变为科学家、工程师或艺术家。随着不断迭代,CUDA在针对AI或神经网络深度学习领域推出了非常多的加速库,构成了CUDA的软硬件生态站。大卫·罗森塔尔在Acquired.FM中介绍,CUDA的代码库是经过优化的,开发人员调用这些库开发程序更加便利。因此,CUDA有庞大的社区资源,2023年5月注册开发者增加至400万人。投入过百亿的CUDA生态英伟达凭借CUDA几乎垄断了训练芯片市场,业界也几乎没有巨头对CUDA生态造成颠覆性冲击。英伟达为CUDA生态铺垫了十余年。2007年,英伟达的GPU研发技术已占据强势地位,次年英特尔的大客户苹果将MacBook除CPU外直接替换成英伟达Tesla架构的GPU便印证了这一点。据报道,经年累计英伟达对CUDA总投入早已超过100亿美元。在黄仁勋商业化考虑之下,CUDA生态需要培养潜在开发者,成为受到程序员和企业欢迎的技术平台。在2006年推出CUDA后,英伟达的第一个战略便瞄准了“软件开发人员”,投入巨资让开发者习惯使用CUDA平台。初期,开发者社区有这样一句话:CUDA在编程语言和共享存储器两个层次的并行都简化了编程,使得本科生也能使用CUDA写出大规模高性能计算程序。为扩大覆盖率,英伟达将CUDA引入大学课堂,与伊利诺伊大学等高校合作完善函数库。在2010年时,已有250所大学开放CUDA的教学课程,并有相关论文数千篇。以此为基础完善生态,英伟达建立研究中心、教学中心、认证计划,到2015年已有800所大学开发相关课程。再从业界来看,英伟达投入资金做inception计划(初创加速计划),让初创公司运用CUDA做项目铺垫基础。至今,已有超过100家初创公司利用了CUDA。此外,英伟达开源了Cub、NCCL等通用场景下的开发库,并优化中间件性能的基础库给厂家使用,再次扩大了生态系统。因此,许多开发者依赖于CUDA,同时凭借强大的核心能力在消费市场上受到青睐。2012年,在ImageNet竞赛一举夺冠的AlexNet面世后,CUDA已迭代至5.0版本,支持了动态库和GPU指针。2016年,OpenAI成立之时,CUDA8.0已经支持半精度浮点数和张量核心,软件生态已由学界和业界人士熟知、互相推荐。2022年底,ChatGPT的发布将生成式AI送到人们眼前,CUDA12.0支持了新的NVIDIAHopper和NVIDIAAdaLovelace架构功能,并为所有GPU提供了额外的编程模型增强。等到大模型热度吹进各家企业时,英伟达已经深化了他们在行业中的差异化,成为市场玩家购物篮的第一选择。目前为止,基于CUDA的GPU销量超过百万。而众多GPU芯片厂家中,为什么是英伟达做出了唯一的CUDA开发环境?从亏钱生意到利润1000%回顾世纪初期,英伟达与微软、ATI、AMD、英特尔五家巨头的混战,英伟达在图形处理市场中逐渐占据优势。2006年7月,AMD以54亿美元溢价收购ATI,芯片市场重新洗牌。同年,英伟达的首席科学家DavidKirk提出了“将GPU技术通用化”的思路,从主要做3D渲染的任务中脱离出来,探索通用计算任务。这个思路就是CUDA。而当时,愿意担起这门费钱费力的技术活的也是英伟达。几大家芯片公司中,老对手AMD买下ATI后GPU研发进入弱势地位,英特尔取消了自研GPU计划。英伟达则在GPU技术方面将巨头们甩在了身后。17年前,研发CUDA是一个超前的决定,英伟达的CUDA进化并非一帆风顺,黄仁勋则坚持“加速计算”是未来。英伟达和英特尔在2006年秋天共同开发了基于CUDA的新型GPU,即G80GPU。而两者的合作持续不长久,CUDA的研发决策需要英伟达长久地投入大量资金。从产品特性上来说,CUDA逻辑电路在硬件产品中增加会导致芯片的散热需求增高,由此也会带来成本上升、故障增多的风险。从财报表现来看,CUDA也是一门亏钱生意,在2008年金融危机前后表现得更为明显。在最艰难的时候,黄仁勋也没有中断CUDA,直到2012年辛顿教授带队以GPU代替CPU训练AI模型做出了AlexNet。2020年,黄仁勋在接受Barron周刊时强调:“英伟达将推动下一个人工智能大爆炸。”这5年,为了迎接人工智能,英伟达做了3件事。第一,2019年3月,英伟达以69亿美元收购了高性能计算互联技术公司Mellanox。这家公司的主要产品InfiniBand,被认为速度更快、带宽更高,是数据传输的有效方式,而Mellanox是唯一的InfiniBand规范提供商。第二,英伟达于2022年9月发布新一代AI芯片“DriveThor”,专为大规模GPU集群协调设计,是英伟达一款完全集成的解决方案。第三,英伟达推出专为加速计算和生成式AI打造的Hopper架构,H100便是基于此架构的GPU。市场消息称,H100是英伟达利润率高达1000%的产品,出货量超过900吨。随着ChatGPT发布,带动AI服务器出货量和价格上涨,英伟达的GPU芯片价格水涨船高。英伟达的DGXH100售价总价为268495美元,包含8GPU+4NVSwitch基板等,每台毛利率接近190000美元。英伟达的财务收入令人瞩目,据悉,过去3个财年的复合年增长率(CAGR)达到35.2%,预计2023年收入将飙升51.4%至408亿美元。CUDA构筑的壁垒能被打破吗?2016年,AMD推出基于开源项目的GPU生态系统ROCm,类似英伟达的CUDA系统,然而ROCm技术相较落后,在2023年4月才登录Windows平台。由于切入时间较晚,AMD开发者数量远也低于英伟达。在Github上,贡献CUDA软件包仓库的开发者超过32600位,而ROCm只有不到600个。英伟达大约占据全球80%的GPU市场份额,光从销量来看,都是一家独大。而英伟达的垄断市场的优势可以持续多久?针对这一问题,SemiAnalysis首席分析师DylanPatel给出观点:随着PyTorch支持更多GPU厂商,再加上OpenAI的Triton搅局,英伟达手中的利器CUDA逐渐锋芒不再。软件生态来看,CUDA的霸主地位确实受到各方攻击。近年,AI开发框架PyTorch因灵活的eager模式使用比率逐渐超越了TensorFlow,PyTorch2.0版本将会对AMD、英特尔、特斯拉、谷歌等GPU和加速器进行支持完善。OpenAI则直接推出了“简化版CUDA:Triton”,操作难度低于CUDA。2023年第一季度,AMD宣布ROCm系统融入PyTorch2.0框架,TensorFlow和Caffe深度学习框架也已加入第五代ROCm。其6月发布下一代数据中心加速处理器(APU)AMDMI300软件方面能够全面兼容英伟达CUDA生态,被业内认为有机会挑战英伟达在人工智能的行业地位。尽管如此,从算力角度来看,英伟达H100的升级产品DGXGH200解决了大规模AI的关键瓶颈,适配资金充沛且性能要求高的潜在客户。短期内,CUDA生态仍然稳健,大多数需要训练芯片的用户在仍然会选择英伟达。...PC版:https://www.cnbeta.com.tw/articles/soft/1390713.htm手机版:https://m.cnbeta.com.tw/view/1390713.htm

封面图片

准备好了吗.Ready.or.Not.2019.Chosen1

名称:准备好了吗.Ready.or.Not.2019.Chosen1描述:格雷斯(萨玛拉·维文SamaraWeaving饰)自幼失去双亲,成长在寄养家庭之中,这样的她再也没有想到自己竟然邂逅了豪门之子亚里克斯(马克·奥布莱恩MarkO'Brien饰),两人的恋爱顺利,通往婚姻的道路一路亮起绿灯。终于,格雷斯满心期待的那一天到来了,然而,在新婚之夜,亚里克斯却告诉了格雷斯一个非常古怪的消息。链接:https://pan.quark.cn/s/b726f796b5e9大小:11G标签:#悬疑#恐怖#准备好了吗#quark频道:@yunpanshare群组:@yunpangroup

封面图片

欧洲的惊呼中,中国车准备好了吗?

欧洲的惊呼中,中国车准备好了吗?“中国品牌是否正在超越欧洲汽车品牌?”瑞士发行量最大的报纸《一瞥报》19日的报道称,在巴黎车展上,比亚迪和长城两家中国公司的展台特别受欢迎,中国汽车制造商模仿西方流行车型、做工糟糕或应付碰撞测试成绩的日子已经一去不复返了,来自中国的新品牌正快速进入欧洲,以至于欧洲品牌可能会感到“害怕”。PC版:https://www.cnbeta.com/articles/soft/1329777.htm手机版:https://m.cnbeta.com/view/1329777.htm

封面图片

英伟达禁止第三方公司兼容 CUDA?相关公司回应

英伟达禁止第三方公司兼容CUDA?相关公司回应据界面新闻,一则有关英伟达试图在其CUDA软件中封杀第三方GPU公司的消息,正引起国内外人工智能及芯片行业的关注。CUDA是英伟达于2006年推出的一套软件平台,专门用于加速GPU计算。对此,英伟达方面并未回应记者的相关问询。针对市场传言,国内GPU公司亦正式做出回应。3月5日晚,GPU芯片公司摩尔线程发布声明称:摩尔线程MUSA/MUSIFY不涉及英伟达EULA相关条款,开发者可放心使用。摩尔线程进一步强调称,由其推出的MUSA架构,与CUDA无任何依赖关系。一直以来,对于如何将CUDA应用迁移到第三方硬件平台,是英伟达对手们的一个难点。一位国内AI芯片企业中层曾向记者表示,用户一旦习惯了CUDA,便很难有动力再迁移出去。因为迁移几乎意味着代码完全重写,工作繁重耗时且不产生经济效益。

封面图片

比亚迪进军美国市场 特拉斯和福特准备好了吗?

比亚迪进军美国市场特拉斯和福特准备好了吗?德意志银行(DeutscheBank)分析师EdisonYu上周四(2月15日)在研报中写道:“比亚迪发言人没有谈到在哪里建厂,但暗示墨西哥新莱昂州(NuevoLeon)和巴希奥工业区(Bajio)可能是候选地点。”特斯拉(TSLA)也计划在新莱昂州建设新厂。Yu写道:“在成为中国电动汽车市场市占率最高的车企之一后,比亚迪正在向海外市场扩张。去年比亚迪出口汽车共计24.3万辆,覆盖70多个国家和地区。”2023年比亚迪销量突破300万辆,其中约8%的汽车销往海外。不过,比亚迪出口的汽车还没有进入美国市场。由于美国对中国进口汽车征收25%的关税,因此中国汽车制造商必须在美国当地生产汽车。如果比亚迪通过降价来抵消美国关税,每辆车的隐含损失将在4000至5000美元之间(根据该公司近期财务表现计算),这还不包括任何运输成本。那么,如果比亚迪必须在美国当地生产汽车,特斯拉和其他美国汽车制造商需要多长时间做准备?建厂一般需要一两年时间,此外,比亚迪还要花时间搭建分销系统。丰田汽车进入美国市场并获得立足之地的经历可以作为参考。丰田于1958年开始在美国销售汽车,当年销量为258辆。到了1963年,丰田在美国拥有125家经销商。销售进口汽车的经销商并没有对美国国内汽车行业构成重大威胁。汽车数据供应商Wards的数据显示,20世纪70年代,丰田在美国的市场份额约为1%。丰田于1972年和1974年在美国进行了首次汽车制造投资。1984年,丰田和通用汽车成立了一家合资公司,即后来卖给特斯拉的加州弗里蒙特工厂。丰田通过20世纪70年代和80年代的制造业扩张,获得了约6个百分点的市场份额。如今,丰田在北美拥有13个工厂,其中包括8个汽车组装工厂。2023年,丰田在北美销售了220万辆汽车,在美国市场的市占率约为14%。丰田在美国建立起制造能力大约20年后,该公司市场份额的增长才开始给美国国内汽车制造商的业绩带来显著影响。如今事情发展的速度比过去更快,所以美国汽车制造商或许还有10年时间做准备。如何做准备是最重要的问题。比亚迪生产低成本电池电动汽车和插电式混合动力汽车,比亚迪电动汽车的电池是自己生产的,这有助于降低成本。目前美国所有汽车制造商都已经或正在建设电池产能,可能会抵消比亚迪的这一优势。墨西哥的劳动力价格低于美国,但美国所有汽车制造商都已经或即将在墨西哥建设产能。综上所述,在竞争中胜出的关键是产品。美国国内汽车制造商有必要推出价格更低、更有吸引力的电动汽车。2024款雪佛兰探界者EV起价3.5万美元,这款车将于2024年年中上市。雪佛兰探界者EV福特目前正在研发“第二代电动汽车”,“第一代电动汽车”包括野马Mach-E和F-150闪电。这些车辆基本都是经过改装的汽油动力平台,并没有针对电动技术进行优化。福特野马Mach-E福特的第二代电动汽车之一将是一款更小、价格更低的车型。特斯拉正在开发下一个汽车平台,该平台将成为一款起价可能低于3万美元的电池电动汽车的基础,这款电动汽车可能会在2025年上市。面临来自比亚迪的竞争,美国汽车制造商的行动速度越快越好。...PC版:https://www.cnbeta.com.tw/articles/soft/1419279.htm手机版:https://m.cnbeta.com.tw/view/1419279.htm

封面图片

科技公司计划通过 UXL 基金会联合打破英伟达的软件垄断

科技公司计划通过UXL基金会联合打破英伟达的软件垄断英伟达除了硬件外还有还有一个让其能维持AI加速计算的领导者的武器,让开发者与英伟达芯片紧密相连的CUDA加速计算软件生态,而现在科技公司正计划通过破坏该秘密武器削弱其垄断。UXL基金会(UnifiedAccelerationFoundation)是一家包括高通、谷歌、英特尔和三星等在内的科技公司联盟,该基金会计划以英特尔开发的一项名为OneAPI的技术为基础,构建一套软件和工具,为多种类型的AI加速器芯片提供支持。该开源项目旨在让计算机代码在任何机器上运行,无论它使用什么芯片和硬件。当前OneAPI已经可用,第三方也已经开始技术贡献,基金会计划今年上半年确定技术规格,并在年内完成所有技术细节。——

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人