OpenAI在国内的两条应用之路走不通了?

OpenAI在国内的两条应用之路走不通了?令高瑞麟陷入两难的,是在奥特曼领导下的OpenAI的一封推送邮件。在6月25日发出的邮件中,OpenAI表示,从今年7月9日开始,将阻止来自非支持国家和地区的API(应用程序接口)服务。受影响组织若希望继续使用OpenAI的服务,必须在其支持的国家或地区内访问。这也意味着,不在支持地区范围内的中国大陆,将迎接OpenAI的“断供”风险。需要注意的是,ChatGPT爆红以来,OpenAI其实一直未曾开放过中国市场的服务。国内大模型创业者李振告诉字母榜(ID:wujicaijing),当前国内想要访问OpenAI的API,一般有两个途径:一是直接向OpenAI官方申请,这种方式更多适合个人开发者;二是通过采购微软云服务,间接接入OpenAI服务,这也是当前国内唯一的合规渠道。据李振观察,目前微软云提供的OpenAI接入服务仍可以正常访问。通过上述两种途径,围绕OpenAI的API,国内大模型玩家也由此发展出了两大应用场景:科技大厂用以帮助训练自己的大模型,在模仿的基础上追求赶超效果;中小企业则用来开发落地应用,在实际使用中向客户提供多样性选择。对于更有实力和资源的大模型玩家而言,即便“断供”政策正式生效,也可能挡不住它们继续调用OpenAI的API的行为,“在一个全球化的市场中,很难存在彻底隔断某一地区访问权限的可能性,就是需要穿越多少围栏的问题。”关注大模型投资的恒业资本创始合伙人江一说道。进入2024年,即便已经出现了一众号称性能媲美GPT-4级别的国产基础大模型,但调用OpenAI技术的需求仍然存在。在江一接触到的合作客户中,有人明确提出希望提供OpenAI技术选项,“面对更开放、更发散性的问答时,OpenAI展现出来的答案还是更强一些。”这也促使一些应用开发商对不同的模型做起人为分割,简单的问题推理,以及涉及垂类行业问答的场景,优先调用国内大模型,偏复杂推理和分析的内容,就交给OpenAI。具体运行环节,有点类似当前业内推崇的MoE混合专家模型逻辑,当客户提出一个问题后,借助机器学习的匹配算法,先将问题分类,从而基于分类结果匹配对应的模型服务商。但是否使用OpenAI服务,还取决于客户是否愿意为此多花钱,“充什么样的会员套餐,给你供应什么样的大模型选择范围。”李振解释道。不同于应用开发者的具体使用需求,那些同样有着自研大模型野心的国内厂商,通过接入OpenAI技术,还能起到辅助刷榜的作用。知名大模型测试集C-Eval就曾在官网置顶声明,称评估永远不可能是全面的,任何排行榜都可能以不健康的方式被黑客入侵,并给出了几种常见的刷榜手法,如对强大的模型(例如GPT-4)的预测结果蒸馏、找人工标注然后蒸馏、在网上找到原题加入训练集中微调模型等等。站在OpenAI的肩膀上,从模仿借鉴中快速赶超,则是国内大模型玩家接入OpenAI技术的更重要目的。去年12月份,字节跳动被爆出正在研发一个名为“种子计划”(ProjectSeed)的AI大模型项目,但该项目在训练和评估模型等多个研发阶段调用了OpenAI的API,并使用ChatGPT输出的数据进行模型训练。此举违反了OpenAI的使用协议,根据规则,OpenAI禁止使用输出开发竞争模型。因此,字节旗下部分GPT使用权限被OpenAI封禁。字节官方坦陈,内部技术团队刚开始进行大模型的初期探索时,确实有部分工程师将ChatGPT的API服务应用于较小模型的实验性项目研究中,但“该模型仅为测试,没有计划上线,也从未对外使用。”部分国产大模型在训练模型速度上快速起步的一大原因,同样离不开对国外大模型的借鉴。去年11月被传出套壳消息时,零一万物在回应字母榜中承认,在训练模型过程中,沿用了GPT/LLaMA的基本架构,但需要说明的是,借鉴架构并不能跟“套壳”或者“抄袭”直接划等号。不过,这确实帮助零一万物缩短了模型研发时间。去年3月,李开复正式宣布将亲自带队,成立一家AI2.0公司,研发通用大模型。经过三个月筹办期,同年7月份,该公司正式定名“零一万物”,并组建起数十人的大模型研发团队。团队成型四个月后,零一万物便在11月份推出了“Yi”系列大模型产品,并借助Yi-34B霸榜多个大模型测试集。在OpenAI“断供”危机之下,国产大模型的战略替代价值越发凸显。在李振看来,从经济账上考量,国内公司直接调用国产大模型会是更为划算的选择。抢在企业迁移之前,一些追求更高收益的个人开发者,已经率先用国产模型替换掉了OpenAI。2022年11月ChatGPT亮相后,受限于政策,一些人开始盯上国内想要尝鲜的用户,做起了卖号生意。当时,ChatGPTPlus官方订阅价格为一个月20美元,国内用户想要使用,收费一般为共享号(供4-6个人使用)一个月50元左右,独享号一个月170元左右。但从2023年下半年开始,随着越来越多国产大模型的发布,加上用户对ChatGPT新鲜感的减弱,越来越多个人开发者已经将技术底座从OpenAI换成了国产平替,订阅价格也随之下降,有的连续包年仅需198元。现在,在AppStore应用商店中搜索“ChatGPT”,各类相似应用程序充斥其中,ChatGtp4o、ChatGp4、ChatGp4o、ChatBPT4.0、ChatGTB4……如今,OpenAI的“断供”之举,给国产大模型厂商提供了一次抢夺中小企业用户的迁移机会。继5月份字节、阿里、百度、腾讯等掀起大模型价格战之外,从6月25日开始,一众国产大模型玩家又纷纷祭出了零成本迁移计划,再次加码性价比之战。截至目前,包括智谱AI、百度、阿里、腾讯、百川智能、零一万物、商汤科技、月之暗面等均已推出了OpenAI零成本迁移计划。为加速用户“搬家”,部分国产大模型还额外附送1千万乃至1亿Tokens,并配套调用、迁徙、训练等多项免费服务大礼包。便宜,只是鼓动用户迁移的必要条件。想要真正赢得用户的青睐,国产大模型还需要做到更好用。去年曾喊出史上最大降价的阿里云,并未能借助价格战换来新的增长。聚焦到国内公有云市场,阿里云市场份额不增反减。IDC发布的《中国公有云服务市场(2023下半年)跟踪》报告显示,2023下半年IaaS市场中,阿里云市场占比27.1%,位居第一。但在2023上半年中国IaaS市场中,阿里云市场份额则为29.9%。更可况,在国产大模型降价的同时,OpenAI们也在降价。按奥特曼的话说,“OpenAI也可以将非常高质量的AI技术成本降至接近零……”想要增强大模型底座的产品吸引力,除了价格之外,更重要的比拼则在数据端。2020年发布GPT-3时,OpenAI曾详细公开了模型训练的所有技术细节。中国人民大学高瓴人工智能学院执行院长文继荣表示,国内很多大模型其实都有GPT-3的影子。但随着OpenAI在GPT-4上一改开源策略,逐渐走向封闭,一些国产大模型就此失去了可供复制的追赶路径。此后,各家大模型拉开技术差距的重点,越来越多体现在训练方法、数据配比、数据工程、细节参数、训练过程监测技巧等细节之中。即便在模型框架相同之下,不同的数据来源和数据训练方法加持下,最终训练出来的大模型性能依然会表现各异。“前大模型时代,AI的主流是以模型为中心的单任务系统,数据基本保持不变。进入大模型时代,算法基本保持恒定,而数据在不断增强增大。”在产业专家刘飞看来,相比算法和算力,数据可能是眼下阻碍国产大模型追赶OpenAI步伐的更大鸿沟,“魔鬼都藏在这些数据训练的细节里。”在国内大模型纷纷跨入万亿参数时代之后,对数据采集和训练的能力考验再次提升。参数量的大小与最终模型呈现的效果之间,两者“投入产出并不成正比...PC版:https://www.cnbeta.com.tw/articles/soft/1436166.htm手机版:https://m.cnbeta.com.tw/view/1436166.htm

相关推荐

封面图片

字节跳动被曝使用ChatGPT训练自家AI,被OpenAI封禁

字节跳动被曝使用ChatGPT训练自家AI,被OpenAI封禁据外媒TheVerge报道,中国科技公司字节跳动一直在秘密使用OpenAI的AI语言大模型ChatGPT来训练自己开发的大模型,并在名为“豆包”的聊天机器人提供相关服务。外媒报道称,字节员工在飞书上讨论如何通过“数据脱敏”来“粉饰”证据。字节对GPT的使用量之大使其员工经常达到API(程序接口)访问的最大限额。而这种行为并不符合OpenAI的使用政策。OpenAI对报道回应称,在进一步调查期间已暂停了字节跳动的帐户。字节跳动则回应称,GPT生成的数据在今年年中已从字节跳动的训练数据中删除。有中媒引用国内业内人士说法称,国内厂商用国外主流模型的API先试水业务、训练模型的情况并不少见。原文链接《TheVerge》《36氪》

封面图片

OpenAI高管:2024年是AI的“应用之年” ChatGPT企业版用户出现爆发式增长

OpenAI高管:2024年是AI的“应用之年”ChatGPT企业版用户出现爆发式增长企业版产品标志着OpenAI从其AI聊天机器人中获利的最重要举措。去年8月份,OpenAI宣布将推出ChatGPT企业版,可提供更高级别的安全和隐私,并承诺对话数据不会用于大模型训练,其执行速度将是普通版GPT-4的两倍。与此同时,该公司面临着来自Anthropic、Cohere以及可以说是其最大投资者微软的竞争,这些同类公司都在争取企业客户。作为OpenAI的首席运营官,Lightcap的任务是为这家AI初创公司建立新的收入来源,并证明生成式AI可以赚取大量资金。Lightcap最引人注目的项目之一是与媒体公司进行谈判,以授权他们的内容开发OpenAI的大模型,并在ChatGPT应用程序中展示这些内容。Lightcap表示:“我对我们在这方面的未来有更多的期待。”此外,OpenAI还在应对纽约时报等媒体公司的诉讼,后者指控这家初创公司未经许可使用其版权作品,并利用其内容创建了AI工具,而这些工具分流了纽约时报网站的流量。Lightcap指出:“这起诉讼没有法律依据,我们从出版业那里听到的绝大多数意见实际上都是相当积极的。”在Lightcap努力建立业务的同时,OpenAI首席执行官山姆·奥特曼一直试图从全球投资者那里筹集数十亿美元,以建立一家芯片企业。当被问及进展时,Lightcap拒绝就这些计划发表评论,但表示全球AI芯片的供应量远远不够。“我们认为,未来10年,供应链将需要适应这种高度变化和近乎指数级的需求。”Lightcap还提到了AI领域的人才争夺战,他说“这肯定是一个竞争激烈的市场,真正能在这个领域产生巨大影响的人很少。”此前一天,特斯拉首席执行官马斯克表示,由于面临人才争夺战,特斯拉一直在提高AI工程师的薪酬。他补充说,ChatGPT的创造者OpenAI一直在“积极招募特斯拉的工程师,提供巨额薪酬,不幸的是,在一些情况下取得了成功。”Lightcap声称,OpenAI目前约有1200名员工。该公司还计划在日本东京开设办事处。“我们的需求非常全球化,所以我们希望出现在客户所在的地方。我们感受到了来自日本和亚洲等地的巨大吸引力。”据悉,日本办事处将是OpenAI在亚洲的首个办事处,该公司去年在伦敦和都柏林分别设立了国际办事处。...PC版:https://www.cnbeta.com.tw/articles/soft/1426239.htm手机版:https://m.cnbeta.com.tw/view/1426239.htm

封面图片

字节跳动回应 “OpenAI 研发大模型致账户被禁”:生成数据已在今年年中删除

字节跳动回应“OpenAI研发大模型致账户被禁”:生成数据已在今年年中删除12月16日下午消息,针对“字节跳动秘密使用OpenAI技术研发大模型,导致账户被暂停”一事,字节跳动回应称,GPT生成的数据已经在今年年中左右,从字节跳动的训练数据中删除。据外媒报道,在生成式AI竞争中处于落后的字节跳动想要“抄近道”,该公司一直在秘密使用OpenAI的技术开发自家大语言模型,这违反了OpenAI的服务条款。目前,字节跳动的账户已被OpenAI暂停。字节跳动的发言人JodiSeth说,GPT生成的数据在“种子计划”的早期开发中用于注解模型,并且在今年年中左右的时候已从字节跳动的训练数据中删除。“字节跳动获得了微软的许可使用GPTAPI。我们使用GPT驱动非中国市场的产品和功能,但使用我们自主开发的模型驱动豆包。豆包只在中国提供。”(新浪科技)

封面图片

字节跳动回应“OpenAI研发大模型致账户被禁”:生成数据已在今年年中删除

新浪科技12月16日下午消息,针对“字节跳动秘密使用OpenAI技术研发大模型,导致账户被暂停”一事,字节跳动回应称,GPT生成的数据已经在今年年中左右,从字节跳动的训练数据中删除。据外媒报道,在生成式AI竞争中处于落后的字节跳动想要“抄近道”,该公司一直在秘密使用OpenAI的技术开发自家大语言模型,这违反了OpenAI的服务条款。目前,字节跳动的账户已被OpenAI暂停。字节跳动的发言人JodiSeth说,GPT生成的数据在“种子计划”的早期开发中用于注解模型,并且在今年年中左右的时候已从字节跳动的训练数据中删除。“字节跳动获得了微软的许可使用GPTAPI。我们使用GPT驱动非中国市场的产品和功能,但使用我们自主开发的模型驱动豆包。豆包只在中国提供。”via匿名标签:#OpenAI#字节跳动#AI频道:@GodlyNews1投稿:@GodlyNewsBot

封面图片

OpenAI 携手 Scale AI,为企业增强 GPT 模型微调功能

OpenAI携手ScaleAI,为企业增强GPT模型微调功能OpenAI近日,宣布和ScaleAI展开深度合作,在企业环境中增强GPT-3.5Turbo和GPT-4大语言模型。OpenAI表示通过双方的深度合作,可以帮助企业定制OpenAI的大语言模型,满足企业的个性化需求。OpenAI在博文中再次强调,通过微调API发送的所有数据均为客户财产,不会被OpenAI或任何其他实体用于训练其他模型。ScaleAI在数据标签和AI解决方案方面有着独到优势,OpenAI将其列为“首选合作伙伴”。来源,频道:@kejiqu群组:@kejiquchat投稿:@kejiqubot

封面图片

OpenAI 科学家翁荔提出外在幻觉extrinsic hallucination 概念

OpenAI科学家翁荔提出外在幻觉extrinsichallucination概念OpenAI科学家翁荔近期在Github上发布文章,提出了一种名为LLM外在幻觉(extrinsichallucination)的全新概念。翁荔表示,模型输出应基于预训练数据集。然而,考虑到预训练数据集的规模,每一代检索和识别冲突的成本太高。如果我们将预训练数据语料库视为世界知识的代表,那么从本质上讲,我们要努力确保模型输出是真实的,并且可以通过外部世界知识进行验证。同样重要的是,当模型不知道某个事实时,它应该说出来。翁荔表示,为了避免外在幻觉的出现,研究者应该保证大模型内容符合事实,同时要保证大模型在适当的时候承认不知道答案。关注频道@ZaiHuaPd频道爆料@ZaiHuabot

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人