AI大模型使用美国开源技术?李开复回应

AI大模型使用美国开源技术?李开复回应当时,零一万物刚刚成立8个月时间,但拥有财力雄厚的投资者,已经是估值达到10亿美元的“独角兽”。李开复在接受采访时将他的AI系统描绘成了其他大模型的替代品,比如Facebook母公司Meta的开源生成式AI模型LLaMA。不过,零一万物那时发布的开源大语言模型Yi-34B采用的部分技术基于LLaMA架构,该公司以Meta的技术为基础,然后使用新数据训练其系统,使其变得更强大。这个事情还曾引起争议。据国内媒体报道,零一研发团队当时回应称,将对大语言模型重命名,从Yi改回LLaMA,公司也将发布改名后的新版本。对此,李开复在最新邮件声明中回应称,就像“大多数其他AI公司一样”,零一万物的AI模型建立在LLaMA基础之上,使用开源技术是行业的一种标准做法。他指出,零一万物使用自己的数据和算法,从头开始训练其AI模型,这些才是其大模型“优越性能”的“主要决定因素”。Meta在回应时引用了公司全球事务主管尼克·克莱格(NickClegg)的评论。克莱格曾表示,公开分享该公司的AI模型有助于传播其价值观和标准,进而有助于确保美国的领导地位。ChatGPT的横空出世引发了一波生成式AI热潮。中国企业也在积极开发生成式AI,但是依赖于美国的底层系统。据十几位科技界内部人士和顶尖工程师表示,中国目前在生成式AI方面落后美国至少一年,而且可能还会进一步落后。...PC版:https://www.cnbeta.com.tw/articles/soft/1419907.htm手机版:https://m.cnbeta.com.tw/view/1419907.htm

相关推荐

封面图片

李开复旗下AI公司“零一万物”开源Yi大模型被指抄袭LLaMA

李开复旗下AI公司“零一万物”开源Yi大模型被指抄袭LLaMAehartford表示,开源社区肯定会重新发布这一模型,并重命名张量以符合LLaMA架构。他希望该公司在模型获得大量采用之前考虑将这一更改应用到官方模型中。此外,网上流传着一张原阿里首席AI科学家贾扬清的朋友圈,内容称“某国内大厂新模型正好就是LLaMA架构,但为了表示不一样,把代码里面的名改成了他们的名字,然后换了几个变量名”。值得一提的是,尽管贾扬清已经在今年3月宣布从阿里巴巴离职并创立了一家新的AI公司LeptonAI,但他并未对这种说法做出回应。截至发稿时,“零一万物”官方尚未对此事进行回应。相关文章:李开复筹建新AI公司:目标不只是中文版ChatGPT希望全球招人李开复旗下创业公司零一万物推出LLM开源模型01.AI估值10亿美元零一万物宣布发布Yi-34B大模型李开复:不负众望...PC版:https://www.cnbeta.com.tw/articles/soft/1396783.htm手机版:https://m.cnbeta.com.tw/view/1396783.htm

封面图片

李开复旗下 AI 公司 “零一万物” 开源 Yi 大模型被指抄袭 LLaMA

李开复旗下AI公司“零一万物”开源Yi大模型被指抄袭LLaMA11月14日消息,创新工场董事长兼CEO李开复于了AI大模型创业公司“零一万物”,该公司已推出 Yi-34B和 Yi-6B两个开源大模型,号称对学术研究完全开放,同步开放免费商用申请。然而在 Yi-34B的HuggingFace开源主页上,开发者ehartford质疑称该模型使用了 MetaLLaMA的架构,只对两个张量(Tensor)名称进行了修改,分别为input_layernorm和post_attention_layernorm。ehartford表示开源社区肯定会重新发布Yi大模型,并重命名张量以符合 LLaMA 架构。他希望该公司在模型获得大量采用之前考虑将这一更改应用到官方模型中,下方则引来了多方议论。此外,网上今日流传着一张原阿里首席AI科学家贾扬清的朋友圈,该内容称“某国内大厂新模型exactly就是LLaMA的架构,但是为了表示不一样,把代码里面的名学从LLaMA改成了他们的名字,然后换了几个变量名”。——

封面图片

李开复再度回应套壳LLaMA争议:大模型通用标准逐渐形成 受益于开源也贡献开源

李开复再度回应套壳LLaMA争议:大模型通用标准逐渐形成受益于开源也贡献开源“全球大模型架构一路从GPT2-->Gopher-->Chinchilla-->Llama2-->Yi,行业逐渐形成大模型的通用标准,就像做一个手机app开发者,不会去自创iOS、Android以外的全新基础架构。01.AI起步受益于开源,也贡献开源,从社区中虚心学习,我们会持续进步。此前,前阿里巴巴副总裁、知名AI框架技术人贾扬清发朋友圈感慨做小公司不容易,希望国内企业如果就是开源的模型结构,不要做换名伪装,免得小公司做一些多余的适配工作。随后,由李开复创立的零一万物因修改LLaMA架构张量(Tensor)名称被卷入质疑风波。相关文章:创新工场CMO发文回应Yi大模型“抄袭LLaMA”事件...PC版:https://www.cnbeta.com.tw/articles/soft/1397377.htm手机版:https://m.cnbeta.com.tw/view/1397377.htm

封面图片

李开复旗下 AI 公司“零一万物”开源 Yi 大模型被指抄袭 LLaMA

李开复旗下AI公司“零一万物”开源Yi大模型被指抄袭LLaMA创新工场董事长兼CEO李开复于今年创办了AI大模型创业公司“零一万物”,该公司已推出 Yi-34B和 Yi-6B两个开源大模型,号称对学术研究完全开放,同步开放免费商用申请。然而在 Yi-34B的HuggingFace开源主页上,开发者ehartford质疑称该模型使用了 MetaLLaMA的架构,只对两个张量(Tensor)名称进行了修改,分别为input_layernorm和post_attention_layernorm。ehartford表示开源社区肯定会重新发布Yi大模型,并重命名张量以符合 LLaMA 架构。他希望该公司在模型获得大量采用之前考虑将这一更改应用到官方模型中,下方则引来了多方议论。此外,网上今日流传着一张原阿里首席AI科学家贾扬清的朋友圈,该内容称“某国内大厂新模型exactly就是LLaMA的架构,但是为了表示不一样,把代码里面的名学从LLaMA改成了他们的名字,然后换了几个变量名”。来源:https://www.ithome.com/0/732/405.htm投稿:@ZaiHuaBot频道:@TestFlightCN

封面图片

李开复公司陷入LLaMa架构命名争议,零一万物回应:将进行代码更新

李开复公司陷入LLaMa架构命名争议,零一万物回应:将进行代码更新「Yi」是由李开复创办的AI公司「零一万物」打造的国产开源大模型,拥有200K上下文窗口,可处理约40万字文本。自推出后,零一万物表示,Yi模型在HuggingFace英文开源社区平台和C-Eval中文评测榜单中,取得多项SOTA国际最佳性能指标认可,成为第一家登顶HuggingFace全球开源模型排行榜的国产模型。科技新闻社区HackerNews的一篇帖子指出,Yi-34B模型完全使用了LLaMa的架构,只是重新命名了两个张量(Tensor,通常用来表示模型的输入、输出和参数),却未提及LLaMa。零一万物昨日回应表示,Yi模型的研发借鉴了行业顶尖水平的公开成果;之所以改名是为了满足训练实验的需求;团队将更新代码。频道:@kejiqu群组:@kejiquchat

封面图片

创新工场CMO发文回应Yi大模型“抄袭LLaMA”事件

创新工场CMO发文回应Yi大模型“抄袭LLaMA”事件根据说明内容显示,零一万物从零开始训练了Yi-34B和Yi-6B模型,并根据实际的训练框架重新实现了训练代码,用自建的数据管线构建了高质量配比的训练数据集(从3PB原始数据精选到3Ttoken高质量数据)。在零一万物初次开源过程中,我们发现用和开源社区普遍使用的LLaMA架构会对开发者更为友好,对于沿用LLaMA部分推理代码经实验更名后的疏忽,原始出发点是为了充分测试模型,并非刻意隐瞒来源。零一万物对此提出说明,并表达诚挚的歉意,我们正在各开源平台重新提交模型及代码并补充LLaMA协议副本的流程中,承诺尽速完成各开源社区的版本更新。相关文章:李开复旗下AI公司“零一万物”开源Yi大模型被指抄袭LLaMA零一万物回应大模型架构争议:对模型和训练的理解做了大量工作...PC版:https://www.cnbeta.com.tw/articles/soft/1397137.htm手机版:https://m.cnbeta.com.tw/view/1397137.htm

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人