超强进化!GPT-4正在改进自己 近万人联名封杀
超强进化!GPT-4正在改进自己近万人联名封杀即使全世界都对超级AI如临大敌,想赶紧悬崖勒马,恐怕也为时已晚。因为,如今的AI,已经学会自我进化了!前段时间,前Google大脑研究工程师EricJang发现:GPT-4能够以合理的方式批评自己的成果。与其为大型语言模型(LLM)寻找完美的提示(让我们一步一步思考),不如让LLM评估自己的输出并立即纠正自己的错误。甚至连特斯拉前AI总监,OpenAI研究科学家AndrejKarpathy大赞,这是一个很好的例子,说明我们还没有看到GPT-4的最大能力。在EricJang给出的例子中,曾看到微软研究员发推说GPT-4根本无法写出‘不押韵’的诗歌。然而,当再去询问GPT-4是否完成了任务。这时,它道歉后,生成了一个不押韵的诗!可以说是满分。这恰恰印证了GPT-4是有‘反思’能力的。最近,来自美国东北大学、MIT等机构研究者提出了Reflexion。这一方法赋予智能体动态记忆,以及自我反思的能力。论文地址:为了验证方法的有效性,研究人员评估了智能体在AlfWorld环境中完成决策任务的能力,以及在HotPotQA环境中完成知识密集型、基于搜索问答任务的能力。在这两项任务的成功率分别为97%和51%。Reflexion智能体的整体架构有网友便表示,你可以通过要求GPT-4反思‘你为什么错了?’,并为自己生成一个新的提示,将这个错误原因考虑在内,直到结果正确,从而将GPT-4的性能提高惊人的30%。另外,论文指出,在测试模型编写代码的能力时,Reflexion+GPT-4也显著优于常规的GPT-4。这样看来,就像EricJang所说,我们现在可以考虑一种‘后缀提示工程’,而不是巧妙的‘前缀提示工程’。这将鼓励LLM在先前生成的解决方案中找到更正和不一致的地方。...PC版:https://www.cnbeta.com.tw/articles/soft/1353143.htm手机版:https://m.cnbeta.com.tw/view/1353143.htm
在Telegram中查看相关推荐
🔍 发送关键词来寻找群组、频道或视频。
启动SOSO机器人