斯坦福团队抄袭清华大模型,事发后紧急删库跑路
斯坦福团队抄袭清华大模型,事发后紧急删库跑路 斯坦福研究团队开发的新型多模态模型Llama3-V因声称性能可与GPT-4V、Gemini Ultra和Claude Opus相媲美,但模型尺寸仅为其一小部分而在网上迅速赢得了知名度。 然而,Llama3-V项目很快卷入争议,指控其剽窃了清华大学和Mianbi Intelligence开发的MiniCPM-Llama3-V 2.5模型的重要部分。 比较显示,Llama3-V的代码和架构几乎与MiniCPM-Llama3-V 2.5相同,包括使用相同的分词器和特殊符号,尽管声称参考了不同的模型。 Llama3-V的作者难以提供相似之处的合理解释,显示出对自己代码库的理解不足。 测试显示,Llama3-V和MiniCPM-Llama3-V 2.5在1000块古代中国竹简数据集上的错误重叠率达87%,进一步暗示了剽窃行为。 面对指控,Llama3-V的作者删除了他们在GitHub和Hugging Face上的项目存储库,但这并未解决争议。 人们发现,通过简单地更改变量名称,Llama3-V的检查点可以与MiniCPM-Llama3-V 2.5的代码库兼容。 剽窃指控引发了对斯坦福研究团队在Llama3-V项目中的道德、诚信和声誉的担忧。 在公众的强烈反对之后,Llama3-V的一位作者道歉,将剽窃归因于对队友穆斯塔法的盲目信任。 一名网友在GitHub上揭发此事后,斯坦福团队迅速删除了相关项目页面,试图掩盖事实。面壁智能团队随后展开调查,发现Llama3-V在多个未公开的特征上与MiniCPM-Llama3-V 2.5表现出高度相似,证实了抄袭行为。 来源:https://tech.ifeng.com/c/8a72Qha8VkJ
在Telegram中查看相关推荐

🔍 发送关键词来寻找群组、频道或视频。
启动SOSO机器人