李开复旗下AI公司“零一万物”开源Yi大模型被指抄袭LLaMA

李开复旗下AI公司“零一万物”开源Yi大模型被指抄袭LLaMAehartford表示,开源社区肯定会重新发布这一模型,并重命名张量以符合LLaMA架构。他希望该公司在模型获得大量采用之前考虑将这一更改应用到官方模型中。此外,网上流传着一张原阿里首席AI科学家贾扬清的朋友圈,内容称“某国内大厂新模型正好就是LLaMA架构,但为了表示不一样,把代码里面的名改成了他们的名字,然后换了几个变量名”。值得一提的是,尽管贾扬清已经在今年3月宣布从阿里巴巴离职并创立了一家新的AI公司LeptonAI,但他并未对这种说法做出回应。截至发稿时,“零一万物”官方尚未对此事进行回应。相关文章:李开复筹建新AI公司:目标不只是中文版ChatGPT希望全球招人李开复旗下创业公司零一万物推出LLM开源模型01.AI估值10亿美元零一万物宣布发布Yi-34B大模型李开复:不负众望...PC版:https://www.cnbeta.com.tw/articles/soft/1396783.htm手机版:https://m.cnbeta.com.tw/view/1396783.htm

相关推荐

封面图片

李开复旗下 AI 公司 “零一万物” 开源 Yi 大模型被指抄袭 LLaMA

李开复旗下AI公司“零一万物”开源Yi大模型被指抄袭LLaMA11月14日消息,创新工场董事长兼CEO李开复于了AI大模型创业公司“零一万物”,该公司已推出 Yi-34B和 Yi-6B两个开源大模型,号称对学术研究完全开放,同步开放免费商用申请。然而在 Yi-34B的HuggingFace开源主页上,开发者ehartford质疑称该模型使用了 MetaLLaMA的架构,只对两个张量(Tensor)名称进行了修改,分别为input_layernorm和post_attention_layernorm。ehartford表示开源社区肯定会重新发布Yi大模型,并重命名张量以符合 LLaMA 架构。他希望该公司在模型获得大量采用之前考虑将这一更改应用到官方模型中,下方则引来了多方议论。此外,网上今日流传着一张原阿里首席AI科学家贾扬清的朋友圈,该内容称“某国内大厂新模型exactly就是LLaMA的架构,但是为了表示不一样,把代码里面的名学从LLaMA改成了他们的名字,然后换了几个变量名”。——

封面图片

李开复旗下 AI 公司“零一万物”开源 Yi 大模型被指抄袭 LLaMA

李开复旗下AI公司“零一万物”开源Yi大模型被指抄袭LLaMA创新工场董事长兼CEO李开复于今年创办了AI大模型创业公司“零一万物”,该公司已推出 Yi-34B和 Yi-6B两个开源大模型,号称对学术研究完全开放,同步开放免费商用申请。然而在 Yi-34B的HuggingFace开源主页上,开发者ehartford质疑称该模型使用了 MetaLLaMA的架构,只对两个张量(Tensor)名称进行了修改,分别为input_layernorm和post_attention_layernorm。ehartford表示开源社区肯定会重新发布Yi大模型,并重命名张量以符合 LLaMA 架构。他希望该公司在模型获得大量采用之前考虑将这一更改应用到官方模型中,下方则引来了多方议论。此外,网上今日流传着一张原阿里首席AI科学家贾扬清的朋友圈,该内容称“某国内大厂新模型exactly就是LLaMA的架构,但是为了表示不一样,把代码里面的名学从LLaMA改成了他们的名字,然后换了几个变量名”。来源:https://www.ithome.com/0/732/405.htm投稿:@ZaiHuaBot频道:@TestFlightCN

封面图片

李开复公司陷入LLaMa架构命名争议,零一万物回应:将进行代码更新

李开复公司陷入LLaMa架构命名争议,零一万物回应:将进行代码更新「Yi」是由李开复创办的AI公司「零一万物」打造的国产开源大模型,拥有200K上下文窗口,可处理约40万字文本。自推出后,零一万物表示,Yi模型在HuggingFace英文开源社区平台和C-Eval中文评测榜单中,取得多项SOTA国际最佳性能指标认可,成为第一家登顶HuggingFace全球开源模型排行榜的国产模型。科技新闻社区HackerNews的一篇帖子指出,Yi-34B模型完全使用了LLaMa的架构,只是重新命名了两个张量(Tensor,通常用来表示模型的输入、输出和参数),却未提及LLaMa。零一万物昨日回应表示,Yi模型的研发借鉴了行业顶尖水平的公开成果;之所以改名是为了满足训练实验的需求;团队将更新代码。频道:@kejiqu群组:@kejiquchat

封面图片

“零一万物”回应 Yi 开源大模型“抄袭 LLaMA”事件:承认做法不妥,将修改争议张量名

“零一万物”回应Yi开源大模型“抄袭LLaMA”事件:承认做法不妥,将修改争议张量名针对开源Yi大模型抄袭LLaMA的事件。“零一万物”正式公开回应了此事,该公司开源团队总监RichardLin承认了修改Llama张量名称的做法不妥,并会按照建议进行修改。RichardLin称此问题是团队的疏忽。因为在大量的训练实验中,他们对代码进行了多次重命名,以满足实验要求。但最后没有在发布之前将它们改回来。他为这个失误造成的混乱表示抱歉。另一名开发者JosephusCheung声称,既然官方已经宣布修改Yi大模型的张量名称,那么开源大模型Yi便是LLaMA的衍生作品,而这显然构成了许可证冲突,因为代码的推理部分和模型定义都是“LLaMA”的一部分。——、

封面图片

创新工场CMO发文回应Yi大模型“抄袭LLaMA”事件

创新工场CMO发文回应Yi大模型“抄袭LLaMA”事件根据说明内容显示,零一万物从零开始训练了Yi-34B和Yi-6B模型,并根据实际的训练框架重新实现了训练代码,用自建的数据管线构建了高质量配比的训练数据集(从3PB原始数据精选到3Ttoken高质量数据)。在零一万物初次开源过程中,我们发现用和开源社区普遍使用的LLaMA架构会对开发者更为友好,对于沿用LLaMA部分推理代码经实验更名后的疏忽,原始出发点是为了充分测试模型,并非刻意隐瞒来源。零一万物对此提出说明,并表达诚挚的歉意,我们正在各开源平台重新提交模型及代码并补充LLaMA协议副本的流程中,承诺尽速完成各开源社区的版本更新。相关文章:李开复旗下AI公司“零一万物”开源Yi大模型被指抄袭LLaMA零一万物回应大模型架构争议:对模型和训练的理解做了大量工作...PC版:https://www.cnbeta.com.tw/articles/soft/1397137.htm手机版:https://m.cnbeta.com.tw/view/1397137.htm

封面图片

李开复再度回应套壳LLaMA争议:大模型通用标准逐渐形成 受益于开源也贡献开源

李开复再度回应套壳LLaMA争议:大模型通用标准逐渐形成受益于开源也贡献开源“全球大模型架构一路从GPT2-->Gopher-->Chinchilla-->Llama2-->Yi,行业逐渐形成大模型的通用标准,就像做一个手机app开发者,不会去自创iOS、Android以外的全新基础架构。01.AI起步受益于开源,也贡献开源,从社区中虚心学习,我们会持续进步。此前,前阿里巴巴副总裁、知名AI框架技术人贾扬清发朋友圈感慨做小公司不容易,希望国内企业如果就是开源的模型结构,不要做换名伪装,免得小公司做一些多余的适配工作。随后,由李开复创立的零一万物因修改LLaMA架构张量(Tensor)名称被卷入质疑风波。相关文章:创新工场CMO发文回应Yi大模型“抄袭LLaMA”事件...PC版:https://www.cnbeta.com.tw/articles/soft/1397377.htm手机版:https://m.cnbeta.com.tw/view/1397377.htm

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人