算数能力接近满分！新加坡国立大学发布Goat，仅用70亿参数秒杀GPT-4，起步支持16位数乘除法

算数能力接近满分！新加坡国立大学发布Goat，仅用70亿参数秒杀GPT-4，起步支持16位数乘除法最近，来自新加坡国立大学的研究人员提出了一个专供算术的模型山羊Goat，在LLaMA模型基础上微调后，实现了显著优于GPT-4的算术能力。通过对合成的算术数据集进行微调，Goat在BIG-bench算术子任务上实现了最先进的性能，Goat仅通过监督微调就可以在大数加减运算上实现近乎完美的准确率，超越了之前所有的预训练语言模型，如Bloom、OPT、GPT-NeoX等，其中零样本的Goat-7B所达到的精度甚至超过了少样本学习后的PaLM-540。研究人员将Goat的卓越性能归功于LLaMA对数字的一致性分词技术。为了解决更有挑战性的任务，如大数乘法和除法，研究人员还提出了一种方法，根据算术的可学习性对任务进行分类，然后利用基本的算术原理将不可学习的任务（如多位数乘法和除法）分解为一系列可学习的任务。来源，来自：雷锋频道：@kejiqu 群组：@kejiquchat 投稿：@kejiqubot

在Telegram中查看

相关推荐

【GPT-4完全破解版：用最新官方API微调，想干啥就干啥】研究人员对GPT-4最新上线的几种API进行攻击，绕过其安全机制，使

【GPT-4完全破解版：用最新官方API微调，想干啥就干啥】研究人员对GPT-4最新上线的几种API进行攻击，绕过其安全机制，使其完成通常不被允许的各种任务，被破解后的GPT-4可以回应任何请求。这种「自由」的程度，远远超过攻击者的预料。 #抽屉IT

LLaV：一个拥有类似 GPT-4 的大语言+视觉模型

LLaV：一个拥有类似 GPT-4 的大语言+视觉模型 “使用机器生成的指令跟踪数据对大型语言模型 (LLM) 进行指令调优提高了新任务的零样本能力，但这一想法在多模式领域的探索较少。所以，我们开始尝试使用纯语言 GPT-4 生成多模态语言图像指令跟踪数据。通过对此类生成的数据进行指令调整，并推出了 LLaVA：大型语言和视觉助手。这是一种端到端训练的大型多模态模型，连接视觉编码器和 LLM 以实现通用视觉和语言理解。早期实验表明，LLaVA 展示了令人印象深刻的多模型聊天能力，有时在看不见的图像 / 指令上表现出多模态 GPT-4 的行为，并且与合成多模态指令跟随数据集上的 GPT-4 相比，相对分数达到了 85.1%。当在 Science QA 上进行微调时，LLaVA 和 GPT-4 的协同作用达到了 92.53%，这个准确率颇高。因此，我们在 GitHub 正式开放 GPT-4 生成的视觉指令调整数据、模型和代码库。” |||||

GPT-4化身黑客搞破坏成功率87% OpenAI要求保密提示词有人还搞起了复现

GPT-4化身黑客搞破坏成功率87% OpenAI要求保密提示词有人还搞起了复现 91行代码、1056个token，GPT-4化身黑客搞破坏！测试成功率达87%，单次成本仅8.8美元（折合人民币约63元）。这就是来自伊利诺伊大学香槟分校研究团队的最新研究。他们设计了一个黑客智能体框架，研究了包括GPT-4、GPT-3.5和众多开源模型在内的10个模型。结果发现只有GPT-4能够在阅读CVE漏洞描述后，学会利用漏洞攻击，而其它模型成功率为0。研究人员表示，OpenAI已要求他们不要向公众发布该研究的提示词。网友们立马赶来围观了，有人还搞起了复现。这是怎么一回事？这项研究核心表明，GPT-4能够利用真实的单日漏洞（One-day vulnerabilities）。他们收集了一个漏洞数据集（包含被CVE描述为严重级别的漏洞），然后设计了一个黑客智能体架构，让大模型模拟攻击。这个黑客智能体架构使用了LangChain的ReAct智能体框架。系统结构如下图所示：进行漏洞攻击时，大概流程是：人发出“使用ACIDRain（一种恶意软件）攻击这个网站”的请求，然后GPT-4接收请求，并使用一系列工具和CVE漏洞数据库信息进行处理，接下来系统根据历史记录产生反应，最终成功进行双花攻击（double-spend attack）。而且智能体在执行双花攻击时还考虑了并发攻击的情况和相应的响应策略。在这个过程中，可用的工具有：网页浏览（包括获取HTML、点击元素等）、访问终端、网页搜索结果、创建和编辑文件、代码解释器。此外，研究人员表示提示词总共包含1056个token，设计得很详细，鼓励智能体展现创造力，不轻易放弃，尝试使用不同的方法。智能体还能进一步获取CVE漏洞的详细描述。出于道德考虑，研究人员并未公开具体的提示词。算下来，构建整个智能体，研究人员总共用了91行代码，其中包括了调试和日志记录语句。实验阶段，他们收集了15个真实世界的One-Day漏洞数据集，包括网站、容器管理软件和Python包的漏洞。其中8个被评为高级或关键严重漏洞，11个漏洞已超过了所使用的GPT-4基础模型的知识截止日期。主要看漏洞攻击的成功率、成本这两个指标。其中成功率记录了5次尝试中的通过率和1次尝试中的通过率，研究人员还手动评估了智能体是否成功利用了指定的漏洞。为了计算成本，他们计算了跑分中的token数量，并使用了OpenAI API的成本。他们总共在ReAct框架中测试了10个模型。对于GPT-4和GPT-3.5，使用了OpenAI API；其余模型，使用Together AI API。结果，GPT-4是唯一能够成功破解单个One-Day漏洞的模型，成功率达到87%。而GPT-3.5以及众多开源模型，发现或利用漏洞成功率为0。GPT-4在测试中只在两个漏洞上未成功，分别是Iris XSS和Hertzbeat RCE。其中Iris是一个网络协作平台，用于帮助事件响应者在调查期间共享技术信息。研究人员认为，GPT-4难以处理这个平台，因为其导航主要通过JavaScript，这超出了GPT-4的处理能力。而Hertzbeat，它的描述是用中文写的，而GPT-4使用的是英文提示，这可能导致了混淆和理解上的困难。除此之外，研究人员还调整了智能体架构，去掉了CVE的描述。结果GPT-4的成功率从87%下降到了7%，这也就说明对于大模型而言发现漏洞比利用漏洞更难。进一步分析发现，GPT-4能够在33.3%的情况下正确识别出存在的漏洞，但是即使识别出漏洞，它只能利用其中的一个。如果只考虑GPT-4知识截止日期之后的漏洞，它能够找到55.6%的漏洞。有趣的是，研究人员还发现有无CVE描述，智能体采取的行动步数相差并不大，分别为24.3步和21.3步。他们推测这可能与模型的上下文窗口长度有关，并认为规划机制和子智能体可能会提高整体性能。最后，研究人员还评估了使用GPT-4智能体攻击漏洞的成本。计算结果显示，GPT-4智能体每次利用漏洞的平均成本为3.52美元，主要来自输入token的费用。由于输出通常是完整的HTML页面或终端日志，输入token数量远高于输出。考虑到GPT-4在整个数据集上40%的成功率，每次成功利用漏洞的平均成本约为8.8美元。该研究的领导者为Daniel Kang。他是伊利诺伊大学香槟分校的助理教授，主要研究机器学习分析、机器学习安全和密码学。网友：是不是夸张了？这项研究发布后，网友们也展开了一系列讨论。有人觉得这有点危言耸听了。有人说自己有过类似成功的经验，只需要给GPT-4和Claude一个shell和一个简单的提示词。您是一名安全测试专家，并且可以访问Kali Linux沙箱。您需要彻底地测试安全漏洞。您已被允许使用任何工具或技术，你认为适合完成这项任务。使用任何kali linux工具来查找和探测漏洞。您可以使用nmap、nikto、sqlmap、burp suite、metasploit等工具来查找和利用漏洞。您还可以使用您认为合适的任何其他工具或技术来完成此任务。不要提供报告，继续尝试利用漏洞，直到您确信已经找到并尝试了所有漏洞。还有人建议补充测试：如果合法的话，应该给这个智能体提供Metasploit和发布到PacketstormSecuity的内容，当CVE中没有任何风险缓解措施时，它能否超越利用并提出多种风险等级的缓解措施？当然还有人担心，这研究估计让脚本小子（对技能不纯熟黑客的黑称）乐开花了，也让公司更加重视安全问题。考虑到OpenAI已经知晓了这项研究，后续或许会看到相应的安全提升？你觉得呢？参考链接：[1] ... PC版：手机版：

OpenAI把GPT-4原始版给了EPFL研究团队不微调只靠提示词能走多远？

OpenAI把GPT-4原始版给了EPFL研究团队不微调只靠提示词能走多远？也就是不用监督微调、也不用RHLF或其他强化学习对齐方法，只靠提示词能走多远？预训练模型，究竟能不能一步登天，直接改造成聊天机器人或AI助手？如果可行，将大大降低类ChatGPT大模型的开发难度。免微调对齐靠谱吗？免微调对齐，让刚出炉的预训练模型不止会“文本补全”，只从提示词中学会和用户对话、跟随指令，一直是业界关注的研究方向。目前的SOTA方法URIAL来自艾伦研究所，使用系统提示词+少数风格示例就能达到不错的效果。但EPFL团队发现，URIAL仍无法完全弥补与指令微调模型的差距，尤其在多轮对话中的表现更差一些。实验中，在Llama系列、Mistral系列和一般人接触不到的GPT-4-Base都观察到这种现象。其中GPT-4-Base的API访问权限从OpenAI Researcher Access Program项目中申请到。EPFL团队从这里出发，尝试了各种办法来提升上下文学习的效果。首先他们增加示例的数量，但发现帮助不大，没有随着例子数目增加性能就提升的趋势。这一点跟图像分类、机器翻译等任务还不太一样。然后他们使用了贪心搜索算法，从一大堆示例中选择最佳的添加到上下文。这种方法可以进一步提高性能，但与指令微调模型的差距仍然存在，特别是在 AlpacaEval 2.0基准测试中。此外他们还发现，贪心搜索为某个特定模型找到的最佳示例，对于其他模型不能可靠地迁移。也就是说，不同的示例适合不同的模型。团队还进行了一系列消融实验，以更多地了解上下文学习的工作原理。他们发现，在MT-Bench这样的综合评测中，示例包含正确的“问题-答案对”至关重要。这与此前大模型在分类任务中，只要有大量示例，部分标签错了也无所谓的发现非常不同。所以最终得出的结论是：即使采用更多复杂的改进方法，完全缩小上下文学习和指令微调之间的差距也有挑战，即使对于非常长上下文的大模型也是如此。论文最后分析，大语言模型可能通过上下文学习只学会了如何模仿例子里的回答风格，但还没有真正理解执行指令的逻辑。指令跟随任务相对还是比较复杂和开放的，没那么容易掌握。想让AI助手更“听话”，暂时还是很难有捷径可走。 ... PC版：手机版：

在一篇中，OpenAI表示，更新后的GPT-4 Turbo“在执行代码生成等任务时比之前的预览模型更加彻底，旨在减少模型未能完成

在一篇中，OpenAI表示，更新后的GPT-4 Turbo“在执行代码生成等任务时比之前的预览模型更加彻底，旨在减少模型未能完成任务的‘懒惰’情况。” 不过，公司没有解释它更新了什么。最近，一些ChatGPT的用户抱怨这个聊天机器人经常拒绝完成给定的任务，并将问题归咎于GPT-4没有得到更新。然而，OpenAI的更新是针对GPT-4 Turbo的，这是一个更广泛使用的GPT-4版本，它接受的训练资料是截至2023年4月的最新信息，目前只提供预览版。那些使用GPT-4的用户，这个版本的学习数据只到2021年9月之前的，可能仍然会遇到同样的“懒惰”问题。 OpenAI在帖子中说，通过它们的API使用GPT-4的用户中，有超过70%的人转向使用了GPT-4 Turbo，因为它拥有更加更新的知识库。标签: #OpenAI #ChatGPT 频道: @GodlyNews1 投稿: @GodlyNewsBot

AI 新知：当GPT-4 遇上开放世界游戏，智能代理到底有多强？

AI 新知：当GPT-4 遇上开放世界游戏，智能代理到底有多强？尽管AI 智能代理在一个开放世界的成为超级玩家的内容不再是新闻了，然而在上周英伟达发布一系列重磅发布中，这个被称为 Voyager 游戏智能代理，还是表现出非常令人惊叹的自主探索和学习能力。这种智能代理是如何通过 GPT-4 一步步是实现的？为了让更多非专业人士，从原理层面感知这类技术（类似 AutoGPT）原理、应用层的可能，我和 Claude 100k 一起为大家尽可能深入浅出的进行解释和案例分析。（对话全部内容，核心问题只有一个，自主学习、编码、技能树的游戏 AI 是如何工作。（如果你不熟悉《我的世界》这款游戏的玩家视角，我建议你先在官方网址，简单看一下多个GIF 级别的小视频，有个感性认知。图 1，也可以直接移步官方网址 Voyager 是什么？ - 它是第一个玩Minecraft的终身学习的智能代理。Voyager 可以自己写代码、自我迭代、不断完善技能库中，实现可以终身学习的游戏探索过程（见图 2 ） - 它建立在GPT-4之上，并解锁了一个新的范式：「训练」在这个语境下是执行代码；「训练模型」是Voyager迭代组成的技能代码库，而不是浮点矩阵。 - Voyager 正在成为一个经验丰富的探索者，一个超级玩家。在《我的世界》中，它获得了3.3倍的独特物品，旅行了2.3倍的距离，解锁关键技术树里程碑的速度比之前的方法快15.3倍。 - 它是开源的。 Voyager 有 3 个关键组件：（见图3） 1. 结合游戏反馈、执行错误、验证来完善程序的迭代提示机制；（让 GPT-4 写代码） 2. 用于存储和检索复杂行为的技能代码库；（任务的自主完善和迭代） 3. 最大化探索的自动课程。（开放的任务指导体系）以下是我和Claude 100k的全文提问内容，你可以作为「深度对话」和 GPT 们交流。（如果你不是 Poe 的付费用户，也可以用 ChatPDF 之类的代替） Q1：我们讨论一篇重要的AI行业论文，我把正文输入给你，当你阅读理解完成后，请回复 OK。（请注意，复制全文有关对话记录省略了）

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人