昆仑万维开源 2 千亿稀疏大模型天工 MoE,全球首创能用 4090 推理

昆仑万维开源2千亿稀疏大模型天工MoE,全球首创能用4090推理据昆仑万维官微,2024年6月3日,昆仑万维宣布开源2千亿稀疏大模型Skywork-MoE,性能强劲,同时推理成本更低。Skywork-MoE基于之前昆仑万维开源的Skywork-13B模型中间checkpoint扩展而来,是首个完整将MoEUpcycling技术应用并落地的开源千亿MoE大模型,也是首个支持用单台4090服务器推理的开源千亿MoE大模型。

相关推荐

封面图片

昆仑万维:“天工 3.0” 超越 GPT4V 多项评测指标达到全球领先水平

昆仑万维:“天工3.0”超越GPT4V多项评测指标达到全球领先水平昆仑万维在互动平台表示,公司现已构建了自主可控的算力集群。目前公司已有算力预计能够满足未来1-2年除视频AIGC之外的大模型算力需求。2024年4月17日,公司正式将天工大模型迭代至3.0版本。“天工3.0”采用4,000亿参数MoE架构,是目前全球模型参数最大、性能最强的开源MoE模型之一。“天工3.0”在语义理解、逻辑推理等方面能力实现质的飞跃,其技术知识能力较上一代模型提升20%,数学、代码等能力提升超30%。同时,在MMBench等多项权威多模态测评结果中,“天工3.0”超越GPT4V,多项评测指标达到全球领先水平。

封面图片

昆仑万维旗下 Opera 全新 AI 服务器集群落地 大模型推理速度提高 30 倍

昆仑万维旗下Opera全新AI服务器集群落地大模型推理速度提高30倍据昆仑万维消息,近日,昆仑万维旗下海外信息分发及元宇宙平台Opera宣布,公司在冰岛凯夫拉维克部署了一套全新的、完全由绿色能源驱动的人工智能(AI)服务器集群。该集群能够为Opera提供先进的AI超级计算能力,并有效简化生产级AI应用的开发和部署过程,为Opera未来更多生成式AI服务打下基础。与上一代GPU相比,搭载NVIDIAH100TensorCoreGPU的方案能让AI训练速度提高4倍,大语言模型推理速度提高30倍。

封面图片

昆仑万维方汉:AI “摩尔定律” 已出现 端侧推理才是最终解决方案

昆仑万维方汉:AI“摩尔定律”已出现端侧推理才是最终解决方案12月14日,昆仑万维董事长、总经理方汉在2023智能未来大会上表示,参考互联网时代发展历程,基于免费模式才能使得AI大模型最大程度普及,这需要通过技术迭代、端侧推理和内容革命等方面实现。目前人工智能(AI)的“摩尔定律”已经出现,即大模型的能力是每年10倍的往上涨,推断成本是每年10倍的往下降。另外,只有端侧推理才是最终的解决方案,随着手机移动设备实现更高参数的推理能力,真正杀手级应用才会出现。据介绍,昆仑万维已经推出了AI游戏、AI音乐和AI漫画。

封面图片

昆仑万维开源数字智能体研发工具包 AgentStudio

昆仑万维开源数字智能体研发工具包AgentStudio据昆仑万维官微,近日,昆仑万维2050全球研究院、新加坡南洋理工大学、苏黎世联邦理工学院研究团队联手开源了数字智能体全流程研发工具包AgentStudio,旨在为研究人员和开发者提供一个覆盖智能体完整开发流程的综合性平台。据了解,AgentStudio是一个完全免费的开源项目。目前,AgentStudio相关论文、代码、数据、文档已全部公开。

封面图片

昆仑万维开源了自己的Skywork大模型 | Skywork

昆仑万维开源了自己的Skywork大模型本次开源的模型有Skywork-13B-Base模型、Skywork-13B-Chat模型、Skywork-13B-Math模型和Skywork-13B-MM模型,以及每个模型的量化版模型,以支持用户在消费级显卡进行部署和推理。Skywork开源项目的特点有:Skywork-13B-Base模型在高质量清洗过滤的3.2万亿个多语言(主要是中文和英文)和代码数据上进行预训练,它在多种评测和各种基准测试上都展现了同等规模模型的最佳效果。Skywork-13B-Chat模型具备强大的对话能力,我们在文创领域进行了进一步的针对性增强。我们通过构建一万多条高质量指令数据集,在10个文创任务上进行了针对性微调,使我们的模型在文创任务中能够接近ChatGPT的效果。此外,我们开源了针对这10个文创任务上的大约500条样本组成的benchmark。Skywork-13B-Math模型经过专门的数学能力强化训练。在13B参数规模下,我们的模型在GSM8K评测上得分第一,同时在MATH数据集以及CMATH上也表现优异,处于13B模型顶尖水平。Skywork-13B-MM多模态模型支持用户输入图片信息进行问答,对话等任务。Skywork/Skypile-150B数据集是根据我们经过精心过滤的数据处理流程从中文网页中筛选出的高质量数据。本次开源的数据集大小约为600GB,总的token数量约为150B,是目前开源最大中文数据集。除此之外,我们还公开了训练Skywork-13B模型中使用的评估方法、数据配比研究和训练基础设施调优方案等信息。我们希望这些开源内容能够进一步启发社区对于大型模型预训练的认知,并推动人工智能通用智能(AGI)的实现。

封面图片

昆仑万维:Opera 成为全球首个接入端侧 AI 大模型的主流浏览器

昆仑万维:Opera成为全球首个接入端侧AI大模型的主流浏览器据昆仑万维官微消息,5月29日,昆仑万维旗下海外信息分发与元宇宙平台Opera宣布,其旗舰浏览器OperaOne以及游戏浏览器OperaGX将正式接入端侧AI大模型,成为全球第一个接入端侧AI大模型的主流浏览器。2024年4月,Opera已在开发者版本浏览器中首次接入了端侧AI大模型,并进行了全面测试。即日起,端侧AI大模型将被正式集成进Opera浏览器旗舰产品中,覆盖Windows、MacOS和Linux等全部设备。

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人