6 月 27 日凌晨,全球著名开源平台 huggingface(笑脸)的联合创始人兼首席执行官 Clem 在社交平台宣布,阿里最

6月27日凌晨,全球著名开源平台huggingface(笑脸)的联合创始人兼首席执行官Clem在社交平台宣布,阿里最新开源的Qwen2-72B指令微调版本,成为开源模型排行榜第一名。他表示,为了提供全新的开源大模型排行榜,使用了300块H100对目前全球100多个主流开源大模型,例如,Qwen2、Llama-3、mixtral、Phi-3等,在BBH、MUSR、MMLU-PRO、GPQA等基准测试集上进行了全新评估。结果显示,阿里开源的Qwen-272B力压科技、社交巨头Meta的Llama-3、法国著名大模型平台Mistralai的Mixtral成为新的王者,中国在全球开源大模型领域处于领导地位。

相关推荐

封面图片

【Huggingface CEO:

【HuggingfaceCEO:#阿里Qwen-2成全球开源大模型排行榜第一,中国处于领导地位】6月27日凌晨,全球著名开源平台huggingface(笑脸)的联合创始人兼首席执行官Clem在社交平台宣布,阿里最新开源的Qwen2-72B指令微调版本,成为开源模型排行榜第一名。他表示,为了提供全新的开源大模型排行榜,使用了300块H100对目前全球100多个主流开源大模型,例如,Qwen2、Llama-3、mixtral、Phi-3等,在BBH、MUSR、MMLU-PRO、GPQA等基准测试集上进行了全新评估。结果显示,阿里开源的Qwen-272B力压科技、社交巨头Meta的Llama-3、法国著名大模型平台Mistralai的Mixtral成为新的王者,中国在全球开源大模型领域处于领导地位。

封面图片

Huggingface CEO:阿里 Qwen-2 成全球开源大模型排行榜第一,中国处于领导地位

HuggingfaceCEO:阿里Qwen-2成全球开源大模型排行榜第一,中国处于领导地位6月27日凌晨,全球著名开源平台huggingface(笑脸)的联合创始人兼首席执行官Clem在社交平台宣布,阿里最新开源的Qwen2-72B指令微调版本,成为开源模型排行榜第一名。他表示,为了提供全新的开源大模型排行榜,使用了300块H100对目前全球100多个主流开源大模型,例如,Qwen2、Llama-3、mixtral、Phi-3等,在BBH、MUSR、MMLU-PRO、GPQA等基准测试集上进行了全新评估。结果显示,阿里开源的Qwen-272B力压科技、社交巨头Meta的Llama-3、法国著名大模型平台Mistralai的Mixtral成为新的王者,中国在全球开源大模型领域处于领导地位。

封面图片

阿里 Qwen2 成开源模型排行榜第一名

阿里Qwen2成开源模型排行榜第一名6月26日,HuggingFace发布博客《排行榜形势停滞,让差距再悬殊一点》,使用更高质量的标准重新测试了全球100多个开源大模型,推出了LLMLeaderboardv2。其中,来自阿里的Qwen2-72B-Instruct以较大优势(6.35分)领先Llama-3-70B-Instruct,暂居榜一。它在数学、长文本推理和知识方面的表现给HuggingFace的评委留下了深刻印象。关注频道@ZaiHuaPd频道爆料@ZaiHuabot

封面图片

阿里通义Qwen2拿下美国最新测评榜单开源大模型全球第一

阿里通义Qwen2拿下美国最新测评榜单开源大模型全球第一图灵奖得主、Meta首席AI科学家杨立昆(YannLeCun)联合Abacus.AI、纽约大学等机构推出全新的大模型测评基准LiveBenchAI,并公布首个测评榜单。阿里云通义千问刚刚开源的大模型Qwen2-72B成为排名最高的开源大模型,是前十榜单中唯一的开源大模型、唯一的中国大模型,成绩超过Meta的Llama3-70B模型。目前,Qwen系列开源模型目前下载量已经突破1600万。来源:格隆汇

封面图片

【英伟达开源Nemotron-4340B系列模型,用于训练LLM】近日,英伟达开源Nemotron-4340B(3400亿参数)

【英伟达开源Nemotron-4340B系列模型,用于训练LLM】近日,英伟达开源Nemotron-4340B(3400亿参数)系列模型。开发人员可使用该系列模型生成合成数据,用于训练大型语言模型(LLM),用于医疗保健、金融、制造、零售和其他行业的商业应用。Nemotron-4340B包括基础模型Base、指令模型Instruct和奖励模型Reward。英伟达使用了9万亿个token(文本单位)进行训练。Nemotron-4340B-Base在常识推理任务,如ARC-c、MMLU和BBH基准测试中,可以和Llama-370B、Mixtral8x22B和Qwen-272B模型媲美。

封面图片

MathGPT:用 Llama 2 打造个性化教育平台

:用Llama2打造个性化教育平台韩国教育公司Mathpresso利用开源模型Llama2打造了数学学习平台QANDA和数学专用语言模型MathGPT。商业语言模型如ChatGPT缺乏针对复杂教育背景的个性化。Llama2灵活开源,Mathpresso可以充分利用自己的数据和技术。MathGPT不仅给出答案,还提供步骤详细的解释,帮助学生深入理解。它在国小和国中数学测试中刷新了世界纪录。韩国AI创业公司Upstage也使用了Llama2。它的模型在开源语言模型排行榜上首次超过了GPT-3.5。Upstage认为Llama2作为顶尖开源语言模型,为他们提供了充分的基础去开发定制化模型。Mathpresso希望通过AI导师,实现个性化教育向所有人开放。Llama2这样的开源模型给了他们灵活性去创造可负担的教育工具。Llama2等开源模型为公司大大小小提供了使用尖端技术的公平机会。它们正在开创性地影响教育等领域。

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人