数学能力超ChatGPT，70B开源大模型火了：用AI微调AI，微软全华班出品#抽屉IT

数学能力超ChatGPT 70B开源大模型火了

数学能力超ChatGPT70B开源大模型火了并且是在参数只有700亿，远不及后三者的情况之下。HuggingFace已上线3个在线可玩版本（分别为7B、13B和70B参数），各种数学题可以直接丢进去试一试。比如解决下面这道四次多项式方程：或者是一道简单的微积分：亦或者是稍微修改过的拉格朗日方程推导：它都全部正确（过程也不需要等太久）。有网友向作者表示：效果真的很惊人，感谢你们对开源LLM的贡献。目前，相关代码、复现方式以及论文也都开源或上线，GitHub短短几天已揽获4.8k标星。那么，WizardMath究竟是如何做到的？用AI生成的指令增强大模型能力OpenAI的大模型（InstructGPT、GPT-4等）能够取得巨大成功、去执行各种复杂和多样化的任务，一部分原因是使用了真实人类用户生成的开放域指令数据进行了微调。然而，不是谁都能像这家公司一样获得这样的指令数据集。一是因为整个注释过程极其昂贵且耗时，二是人工难以创建出足够比例的高难度指令。因此，开发出一种成本相对较低的、大规模开放域指令自动生产方法，成为当下指令调优语言模型的关键。在此，作者将他们的方法命名为EvolInstruction。它是一种利用AI来代替人类自动生成涵盖各种难度级别开放域指令的新方法。具体而言，EvolInstruction分为指令进化器和指令消除器。其中指令进化器可通过深度进化（蓝线）或广度进化（红线）两种路径，将简单指令升级为更复杂的指令或创建一条全新指令。具体执行哪一条？随机选择就好。其中，深度进化的具体“进化法”，则是通过五种类型的操作来完成，包括：添加约束（addconstraints）、深化（deepening）、具体化（concretizing）、增加推理步骤（increasereasoningsteps）和使输入复杂化（complicateinput）。由于所有指令均由AI完成，有时难免会出现错误。因此，指令消除器就是用于过滤失败指令的。以下是一个具体示例，该方法从“1+1=？”开始，最终通过以上步骤自动生成了相当多的新指令。通过重复这一生成过程，最终我们就能得到足够多的指令，然后将它们合并并随机打乱，组成一个难度级别均匀分布的指令集，就可以对基础大模型进行微调了。在此，作者选择Alpaca的训练数据（仅由175条人工创建的种子指令生成）作为初始数据集，然后使用ChatGPT的API执行了四个进化周期，最终获得25万条指令。为了与Vicuna的70k真实用户数据（ShareGPT）进行公平比较，作者从这25万条数据中抽取了等量的样本，训练LLaMA7B模型，最终得到WizardLM，结果WizardLM的性能明显优于Vicuna。（Alpaca：斯坦福在LLaMa-7B基础上微调出来的模型；Vicuna，UC伯克利在LLaMa-13B的基础上微调得来）此外，在更为复杂的测试指令下，人类更喜欢WizardLM的输出，而非ChatGPT，这表明该方法可以显着提高LLM处理复杂指令的能力。基于此，作者又利用EvolInstruction生成了很多数学领域相关的指令，然后微调羊驼大模型，得到了WizardMath。其效果如开头所示，在GSM8k数据集上测得其数学能力超越包括ChatGPT、ClaudeInstant1、PaLM2-540B等一众大模型，位列第5名，仅次于GPT-4、Claud1.3和2.0，以及5400亿参数的Flan-PaLM2之后。以此类推，作者还在羊驼之上得到了专攻代码能力的WizardCoder，效果超越Claude和Bard（详情可戳文末地址）。团队介绍本文共9位作者，全华人。一作有3位：CanXu，微软亚洲互联网工程院S+DNLP组高级应用科学家，之前曾在微软小冰研究组和微软亚研院从事聊天机器人系统工作；QingfengSun，MicrosoftResearch科学家，研究方向为自然语言处理和信息检索，精通构建高效搜索系统，为MicrosoftBing和Office365贡献了核心深度模型；KaiZheng，MicrosoftResearch科学家，研究方向为自然语言处理、搜索和推荐排名，同样为MicrosoftBing和Office365贡献了核心深度模型。通讯作者为姜大昕，微软全球合伙人、副总裁、前微软亚洲研究院首席科学家，在微软工作16年有余、曾作为微软必应搜索引擎和Cortana智能助手自然语言理解负责人，日前已被曝离职投身大模型创业。另还有一位作者JiazhanFeng，是北大学生，这篇合著论文是TA在微软实习时产出的。项目主页：https://github.com/nlpxucan/WizardLM/tree/main/WizardMath...PC版：https://www.cnbeta.com.tw/articles/soft/1376959.htm手机版：https://m.cnbeta.com.tw/view/1376959.htm

微软宣布开源DeepSpeedChat，帮助用户训练类ChatGPT等大语言模型

微软开源 Visual ChatGPT

OpenAI的ChatGPT（GPT3版本）是基于大语言模型，专门训练以文本形式的对话与用户互动。它不是基于多模态模型，不支持图像或语音的输入输出。如果我们想要构建一个类似ChatGPT的支持图像理解和生成的系统，那么可能需要使用一个多模态会话模型进行训练。但此类的训练需要消耗大量的数据和算力资源。与此从头开始构建一个全新的系统，不如站在巨人的肩膀上。微软亚洲研究院的研究人员在预印本网站arxiv上发表论文《VisualChatGPT:Talking,DrawingandEditingwithVisualFoundationModels》，提出在ChatGPT 和多个VisualFoundationModels基础上构建VisualChatGPT。源代码托管在GitHub上。投稿：@ZaiHuabot频道：@TestFlightCN

ChatGPT失业危机!微软Copilot重磅升级,图文代码能力暴涨,还免费#抽屉IT

Databricks 发布开源指令微调大语言模型 Dolly 2.0

Databricks发布开源指令微调大语言模型Dolly2.0Databricks公司两周前发布了它的指令遵循（instruction-following）大语言模型Dolly，本周三它发布了——可授权商业使用的开源指令微调大语言模型。Dolly2.0有120亿参数，基于EleutherAIpythia模型家族，使用高质量的人类生成的指令遵循数据集进行微调。Databricks开源了Dolly2.0的整个系统，包括训练代码、数据集和模型权重，全都适合商业使用。而目前开源社区流行的LLaMA衍生模型使用的是非商业使用授权。来源，来自：雷锋频道：@kejiqu群组：@kejiquchat投稿：@kejiqubot

数学能力超ChatGPT，70B开源大模型火了：用AI微调AI，微软全华班出品#抽屉IT

相关推荐