阿里开源创新大模型ZeroSearch 无需外部搜索引擎而自学检索
阿里开源创新大模型ZeroSearch 无需外部搜索引擎而自学检索 阿里巴巴近日开源了一种创新大模型 ZeroSearch ,在训练过程中无需调用任何外部搜索引擎即可掌握信息检索能力。新模型表现堪比甚至超越依赖真实搜索引擎训练的模型,而且更节约训练成本。 在涵盖七个问答数据集的对比测试中,该模型 7B 参数的检索模块便能达到与 Google 搜索相当的水平,而 14B 参数版本则表现更佳。更令人瞩目的是其成本优势:若通过 SerpAPI 调用 Google 搜索执行 64,000 次查询,训练费用约为 586.70 美元;而在 4 块 NVIDIA A100 GPU 上运行 14B 参数的模拟 LLM,仅需约 70.80 美元,成本削减高达 88%。 目前,ZeroSearch 已在 Qwen-2.5、LLaMA-3.2 等多个主流模型家族中完成验证。研究团队已将全部代码、数据集及预训练模型开源至 GitHub 和 Hugging Face。 【全球大事件】 助您掌握时事,稳操胜券! #China #全球大事件 #热点新闻 #投稿曝光
在Telegram中查看相关推荐

🔍 发送关键词来寻找群组、频道或视频。
启动SOSO机器人