AI 新知：当GPT-4 遇上开放世界游戏，智能代理到底有多强？

AI 新知：当GPT-4 遇上开放世界游戏，智能代理到底有多强？尽管AI 智能代理在一个开放世界的成为超级玩家的内容不再是新闻了，然而在上周英伟达发布一系列重磅发布中，这个被称为 Voyager 游戏智能代理，还是表现出非常令人惊叹的自主探索和学习能力。这种智能代理是如何通过 GPT-4 一步步是实现的？为了让更多非专业人士，从原理层面感知这类技术（类似 AutoGPT）原理、应用层的可能，我和 Claude 100k 一起为大家尽可能深入浅出的进行解释和案例分析。（对话全部内容，核心问题只有一个，自主学习、编码、技能树的游戏 AI 是如何工作。（如果你不熟悉《我的世界》这款游戏的玩家视角，我建议你先在官方网址，简单看一下多个GIF 级别的小视频，有个感性认知。图 1，也可以直接移步官方网址 Voyager 是什么？ - 它是第一个玩Minecraft的终身学习的智能代理。Voyager 可以自己写代码、自我迭代、不断完善技能库中，实现可以终身学习的游戏探索过程（见图 2 ） - 它建立在GPT-4之上，并解锁了一个新的范式：「训练」在这个语境下是执行代码；「训练模型」是Voyager迭代组成的技能代码库，而不是浮点矩阵。 - Voyager 正在成为一个经验丰富的探索者，一个超级玩家。在《我的世界》中，它获得了3.3倍的独特物品，旅行了2.3倍的距离，解锁关键技术树里程碑的速度比之前的方法快15.3倍。 - 它是开源的。 Voyager 有 3 个关键组件：（见图3） 1. 结合游戏反馈、执行错误、验证来完善程序的迭代提示机制；（让 GPT-4 写代码） 2. 用于存储和检索复杂行为的技能代码库；（任务的自主完善和迭代） 3. 最大化探索的自动课程。（开放的任务指导体系）以下是我和Claude 100k的全文提问内容，你可以作为「深度对话」和 GPT 们交流。（如果你不是 Poe 的付费用户，也可以用 ChatPDF 之类的代替） Q1：我们讨论一篇重要的AI行业论文，我把正文输入给你，当你阅读理解完成后，请回复 OK。（请注意，复制全文有关对话记录省略了）

在Telegram中查看

相关推荐

如果我们在 Minecraft 中解放 GPT-4 会怎样？

如果我们在 Minecraft 中解放 GPT-4 会怎样？我很高兴地宣布 Voyager，这是第一个完全在上下文中玩 Minecraft 的终身学习代理。 Voyager 通过编写、提炼、提交和从技能库中检索*代码*不断改进自己。 GPT-4 解锁了一种新范式：“训练”是代码执行而不是梯度下降。 “训练有素的模型”是 Voyager 迭代组合的技能代码库，而不是浮点数矩阵。我们正在将无梯度架构推向极限。

AI 新知：为什么基础代理将会是下一个革命性技术？

AI 新知：为什么基础代理将会是下一个革命性技术？来自英伟达高级研究员 & AI Agents负责人Jim Fan 近期释放的TED 演讲，《The next grand challenge for AI》提出了「基础代理」将在虚拟世界和物理世界中无缝运行。他解释了这项技术将如何从根本上改变我们的生活渗透到从视频游戏、元宇宙到无人机和仿人机器人的方方面面并探讨了这一模型如何掌握跨越这些不同现实的技能。他提出「基础代理」（Foundation Agent）的秘诀：一个单一的模型，可以学习如何在不同的世界中行动。（如果你之前不太熟悉AI agents相关基础知识，可以结合文本内容补充相关知识点，Enjoy）「基础代理」中的智能体， Voyager 是什么？？ - 它是一个在 Minecraft开放世界中无限学习的智能体。Voyager 可以自己写代码、自我迭代、不断完善技能库中，实现无限学习（Longlife learning）的探索过程。 - 这里核心只有一个，就是无限迭代。它不断扩充自己的技能图书馆，无论是在游戏中制作工具，并升级科技树（例如，从Wooden Tool 到Iron Tool），全部是自主迭代、自主验证的。它不仅是自动化，它是通过一套机制自主学习 [1]。 - 它建立在GPT-4之上，并解锁了一个新的范式：「训练」在这个语境下是执行代码；「训练模型」是Voyager迭代组成的技能代码库，而不是浮点矩阵。 - Voyager 作为一个超级玩家，在《我的世界》中，它获得了3.3倍的独特物品，旅行了2.3倍的距离，解锁关键技术树里程碑的速度比之前的方法快15.3倍。它还开源的。 [1] 为什么这个「基础代理」具有非凡意义？ - LLM 适用于大量文本，而基础代理可以跨越很多很多现实。基础代理已经在虚拟世界被验证强大的学习自主性。 - 其次，Jim Fan 认为它具有跨越Reality的拓展性。开放游戏世界Minecraft 只是作为一个模拟现实（simulated realities）和实验基地，他们还在其他仿真环境进行训练和探索得到惊人进展。[2] - 如果它能够掌握 10,000 种不同的模拟现实，那么它就能很好地推广到我们的物理世界，而物理世界只是第 10,001 个现实。 - 换句话说，它正在加速应用于物理世界，特别是机器人技术。参考Jim Fan的PPT 。 [3] Hans 注释： [1] 这套自主学习和迭代的机制，有三个核心组件： a）结合游戏反馈、执行错误、自我验证来完善程序的迭代提示机制；（让 GPT-4 写代码） b）用于存储和检索复杂行为的技能代码库；（任务的完善和迭代，成为了技能） c）最大化探索的自动课程。Hans 在去年相关论文讨论的《当GPT-4 遇上开放世界》中，有更详细的解读。 [2] 英伟达 Isaac Gym 是一个功能强大的端到端 GPU 加速仿真环境，用于强化学习，可用于训练机器人和模型。它是英伟达 Omniverse 平台的一部分，为机器人和计算机视觉算法提供基于物理的高保真模拟。 [3] TED 视频中Jim Fan的PPT ： Invalid media:

OpenAI 正式公布人工智能语言模型 GPT-4

OpenAI 正式公布人工智能语言模型 GPT-4 3月15日早间，人工智能初创公司 OpenAI 正式公布最新一代人工智能语言模型 GPT-4。它是 OpenAI 在放大深度学习方面的努力的最新里程碑，是一个大型多模态模型，可接受图像和文本输入，发出文本输出。 GPT-4 对月订阅费20美元 ChatGPT Plus 用户开放使用，同时也会纳入到微软的 Bing 聊天机器人中。相关链接： - OpenAI-GPT-4 https://openai.com/research/gpt-4 - GPT-4 Developer Livestream http://www.youtube.com/watch?v=outcGtbnMuQ - ChatGPT Plus 访问 GPT-4 https://chat.openai.com - GPT-4 API 候补名单申请 https://openai.com/waitlist/gpt-4-api - 优先获得 API 权限的方法 https://github.com/openai/evals

#小众软件不再排队，微软新必应针对 Edge “全面”开放，可实现 GPT-4 智能提问、DALL·E 的 AI 绘画

#小众软件不再排队，微软新必应针对 Edge “全面”开放，可实现 GPT-4 智能提问、DALL·E 的 AI 绘画 Tags: #AI, #业界消息, #ChatGPT, #twp, #必应

GPT Migrate，一个基于 GPT-4 的大胆尝试，让 AI 重写整个项目代码

GPT Migrate，一个基于 GPT-4 的大胆尝试，让 AI 重写整个项目代码使用可以将原有的 Python 项目，用 JavaScript 重写为新项目，AI 会自动帮你生成新的目录结构、文件命名、项目依赖包。来自：雷锋频道：@kejiqu 群组：@kejiquchat 投稿：@kejiqubot

哈佛的CS50课程节选：GPT-4是如何工作的？

哈佛的CS50课程节选：GPT-4是如何工作的？在这门课程中，介绍了GPT-4的基本概念和工作原理，介绍了GPT-4的基本概念、工作原理和应用前景，展示了其在各种场景下的强大能力。 GPT-4作为一种生成式AI和大型语言模型，是基于神经网络和人工智能的。它可以作为文化模拟器、文本预测器、写作助手和内容生成器。 GPT-4的训练目标是预测给定单词序列的下一个单词。通过对五万个单词的词汇表进行概率分布生成，模型可以生成各种可能的后续单词。通过不断迭代这一过程，GPT-4能够生成连贯的文本。随着模型训练时间的增加，GPT-4表现出越来越强的表现力和能力，甚至变得更加“聪明”。这使得它能够模仿不同类型的文本风格和语言注册。例如，GPT-3通过观察大量问题和答案示例，实际上已经知道如何回答问题，从而形成了ChatGPT。这使得GPT-4可以以问答的形式工作，为用户提供解决问题的帮助。此外，GPT-4通过指令调整、强化与人类反馈对齐等方法，与现有的工具和服务相结合。这使得GPT-4能够帮助用户执行各种任务，如搜索网络、查找食谱等。通过将GPT-4转变为代理，实现任何模糊目标成为未来发展的方向。 |

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人