零一万物回应大模型架构争议:对模型和训练的理解做了大量工作

零一万物回应大模型架构争议:对模型和训练的理解做了大量工作零一万物研发大模型的结构设计基于GPT成熟结构,借鉴了行业顶尖水平的公开成果,由于大模型技术发展还在非常初期,与行业主流保持一致的结构,更有利于整体的适配与未来的迭代。同时零一万物团队对模型和训练的理解做了大量工作,也在持续探索模型结构层面本质上的突破。相关文章:李开复旗下AI公司“零一万物”开源Yi大模型被指抄袭LLaMA...PC版:https://www.cnbeta.com.tw/articles/soft/1396831.htm手机版:https://m.cnbeta.com.tw/view/1396831.htm

相关推荐

封面图片

李开复公司陷入LLaMa架构命名争议,零一万物回应:将进行代码更新

李开复公司陷入LLaMa架构命名争议,零一万物回应:将进行代码更新「Yi」是由李开复创办的AI公司「零一万物」打造的国产开源大模型,拥有200K上下文窗口,可处理约40万字文本。自推出后,零一万物表示,Yi模型在HuggingFace英文开源社区平台和C-Eval中文评测榜单中,取得多项SOTA国际最佳性能指标认可,成为第一家登顶HuggingFace全球开源模型排行榜的国产模型。科技新闻社区HackerNews的一篇帖子指出,Yi-34B模型完全使用了LLaMa的架构,只是重新命名了两个张量(Tensor,通常用来表示模型的输入、输出和参数),却未提及LLaMa。零一万物昨日回应表示,Yi模型的研发借鉴了行业顶尖水平的公开成果;之所以改名是为了满足训练实验的需求;团队将更新代码。频道:@kejiqu群组:@kejiquchat

封面图片

零一万物发布Yi大模型API开放平台 首批开放3款大模型

零一万物发布Yi大模型API开放平台首批开放3款大模型在全球多项权威评测榜单中,Yi大模型表现优异,性能直追GPT-4。此前,Yi大模型API已经小范围开放内测,全球已有不少开发者申请使用,并普遍反馈效果超出预期。基于此,此次Yi大模型API正式推出3款模型,给开发者更多惊喜。目前,Yi大模型API名额限量开放中,新用户赠送60元。Yi大模型API与OpenAIAPI完全兼容,开发者只需修改少量代码,可以平滑迁移。此次Yi大模型API开放平台提供以下模型:•Yi-34B-Chat-0205:支持通用聊天、问答、对话、写作、翻译等功能。•Yi-34B-Chat-200K:200K上下文,多文档阅读理解、超长知识库构建小能手。•Yi-VL-Plus:多模态模型,支持文本、视觉多模态输入,中文图表体验超过GPT-4V。零一万物API开放平台链接:https://platform.lingyiwanwu.com/零一万物Yi-34B-Chat-200K模型支持处理约30万个中英文字符,适合用于多篇文档内容理解、海量数据分析挖掘和跨领域知识融合等,在“大海捞针”测试中,Yi-34B-Chat-200K的性能提高了10.5%,从89.3%提升到99.8%。例如,金融分析师可以用Yi-34B-Chat-200K模型快速阅读报告并预测市场趋势、律师可以用它精准解读法律条文、科研人员可以用它高效提取论文要点、文学爱好者可以用它快速掌握作品精髓等,应用场景非常广泛。Yi-34B-Chat-200K对经典文学作品《呼啸山庄》进行复杂角色和角色关系的归纳总结零一万物开发的多模态模型Yi-VL-Plus,可支持文本、视觉多模态输入,面向实际应用场景大幅增强,包括:增强Charts,Table,Inforgraphics,Screenshot识别能力,支持复杂图表理解、信息提取、问答以及推理。中文图表体验超过GPT4V;Yi-VL-Plus模型在一些中文图表理解场景,比GPT-4V准确率更高在Yi-VL基础上进一步提高了图片分辨率,模型支持1024*1024分辨率输入,显著提高生产力场景中的文字、数字OCR的准确性;保持了LLM通用语言、知识、推理、指令跟随等能力。同时,零一万物还表示,近期零一万物将为开发者提供更多更强模型和AI开发框架,提供更加丰富和灵活的开发工具,以适应多样化的应用场景。相关文章:李开复旗下创业公司零一万物推出LLM开源模型01.AI估值10亿美元零一万物宣布发布Yi-34B大模型李开复:不负众望李开复旗下AI公司“零一万物”开源Yi大模型被指抄袭LLaMA零一万物回应大模型架构争议:对模型和训练的理解做了大量工作...PC版:https://www.cnbeta.com.tw/articles/soft/1423641.htm手机版:https://m.cnbeta.com.tw/view/1423641.htm

封面图片

“零一万物”回应 Yi 开源大模型“抄袭 LLaMA”事件:承认做法不妥,将修改争议张量名

“零一万物”回应Yi开源大模型“抄袭LLaMA”事件:承认做法不妥,将修改争议张量名针对开源Yi大模型抄袭LLaMA的事件。“零一万物”正式公开回应了此事,该公司开源团队总监RichardLin承认了修改Llama张量名称的做法不妥,并会按照建议进行修改。RichardLin称此问题是团队的疏忽。因为在大量的训练实验中,他们对代码进行了多次重命名,以满足实验要求。但最后没有在发布之前将它们改回来。他为这个失误造成的混乱表示抱歉。另一名开发者JosephusCheung声称,既然官方已经宣布修改Yi大模型的张量名称,那么开源大模型Yi便是LLaMA的衍生作品,而这显然构成了许可证冲突,因为代码的推理部分和模型定义都是“LLaMA”的一部分。——、

封面图片

李开复旗下 AI 模型 “零一万物 API” 上线,支持文档理解、图片问答等

李开复旗下AI模型“零一万物API”上线,支持文档理解、图片问答等李开复旗下零一万物日前上线官方API,用户可以体验Yi系列AI大模型,其中包含yi-34b-chat-0205、yi-34b-chat-200k、yi-vl-plus。其中yi-vl-plus支持1024*1024高分辨率图片输入,具备图片问答、图表理解、OCR、视觉推理能力。适用于对复杂图表、截图的内容分析,包括信息识别、提取、理解、推理等。(品玩)

封面图片

【零一万物对Yi-34B训练过程的说明】

【零一万物对Yi-34B训练过程的说明】在零一万物初次开源过程中,我们发现用和开源社区普遍使用的LLaMA架构会对开发者更为友好,对于沿用LLaMA部分推理代码经实验更名后的疏忽,原始出发点是为了充分测试模型,并非刻意隐瞒来源。零一万物对此提出说明,并表达诚挚的歉意,我们正在各开源平台重新提交模型及代码并补充LLaMA协议副本的流程中,承诺尽速完成各开源社区的版本更新。(零一万物01AI微信公号)

封面图片

零一万物宣布发布Yi-34B大模型 李开复:不负众望

零一万物宣布发布Yi-34B大模型李开复:不负众望作为国产大模型,Yi-34B更“懂”中文。在C-Eval中文权威榜单排行榜上超越了全球所有开源模型。对比大模型标杆GPT-4,在CMMLU、E-Eval、Gaokao三个主要的中文指标上,Yi-34B也具有绝对优势,凸显中文世界的优异能力,更好地满足国内市场需求。伴随着Yi-34B的发布,零一万物团队也首度亮相,成员来自Google、微软、阿里巴巴、百度、字节跳动、腾讯等企业。其中,零一万物技术副总裁及AIAlignment负责人是GoogleBard/Assistant早期核心成员,主导或参与了从Bert、LaMDA到大模型在多轮对话、个人助理、AIAgent等多个方向的研究和工程落地;首席架构师曾在GoogleBrain与JeffDean、SamyBengio等合作,为TensorFlow的核心创始成员之一。零一万物技术副总裁及Pretrain负责人黄文灏曾先后任职于微软亚洲研究院和智源研究院。在微软从事AIAgent研究工作时,得到微软创始人比尔·盖茨和CEO萨提亚·纳德拉的高度赞扬。而支持Yi模型训练保障交付的零一万物技术副总裁及AIInfra负责人戴宗宏,是前华为云AICTO及技术创新部长、前阿里达摩院AIInfra总监。...PC版:https://www.cnbeta.com.tw/articles/soft/1394913.htm手机版:https://m.cnbeta.com.tw/view/1394913.htm

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人