AI 新知：为什么基础代理将会是下一个革命性技术？

AI 新知：为什么基础代理将会是下一个革命性技术？来自英伟达高级研究员 & AI Agents负责人Jim Fan 近期释放的TED 演讲，《The next grand challenge for AI》提出了「基础代理」将在虚拟世界和物理世界中无缝运行。他解释了这项技术将如何从根本上改变我们的生活渗透到从视频游戏、元宇宙到无人机和仿人机器人的方方面面并探讨了这一模型如何掌握跨越这些不同现实的技能。他提出「基础代理」（Foundation Agent）的秘诀：一个单一的模型，可以学习如何在不同的世界中行动。（如果你之前不太熟悉AI agents相关基础知识，可以结合文本内容补充相关知识点，Enjoy）「基础代理」中的智能体， Voyager 是什么？？ - 它是一个在 Minecraft开放世界中无限学习的智能体。Voyager 可以自己写代码、自我迭代、不断完善技能库中，实现无限学习（Longlife learning）的探索过程。 - 这里核心只有一个，就是无限迭代。它不断扩充自己的技能图书馆，无论是在游戏中制作工具，并升级科技树（例如，从Wooden Tool 到Iron Tool），全部是自主迭代、自主验证的。它不仅是自动化，它是通过一套机制自主学习 [1]。 - 它建立在GPT-4之上，并解锁了一个新的范式：「训练」在这个语境下是执行代码；「训练模型」是Voyager迭代组成的技能代码库，而不是浮点矩阵。 - Voyager 作为一个超级玩家，在《我的世界》中，它获得了3.3倍的独特物品，旅行了2.3倍的距离，解锁关键技术树里程碑的速度比之前的方法快15.3倍。它还开源的。 [1] 为什么这个「基础代理」具有非凡意义？ - LLM 适用于大量文本，而基础代理可以跨越很多很多现实。基础代理已经在虚拟世界被验证强大的学习自主性。 - 其次，Jim Fan 认为它具有跨越Reality的拓展性。开放游戏世界Minecraft 只是作为一个模拟现实（simulated realities）和实验基地，他们还在其他仿真环境进行训练和探索得到惊人进展。[2] - 如果它能够掌握 10,000 种不同的模拟现实，那么它就能很好地推广到我们的物理世界，而物理世界只是第 10,001 个现实。 - 换句话说，它正在加速应用于物理世界，特别是机器人技术。参考Jim Fan的PPT 。 [3] Hans 注释： [1] 这套自主学习和迭代的机制，有三个核心组件： a）结合游戏反馈、执行错误、自我验证来完善程序的迭代提示机制；（让 GPT-4 写代码） b）用于存储和检索复杂行为的技能代码库；（任务的完善和迭代，成为了技能） c）最大化探索的自动课程。Hans 在去年相关论文讨论的《当GPT-4 遇上开放世界》中，有更详细的解读。 [2] 英伟达 Isaac Gym 是一个功能强大的端到端 GPU 加速仿真环境，用于强化学习，可用于训练机器人和模型。它是英伟达 Omniverse 平台的一部分，为机器人和计算机视觉算法提供基于物理的高保真模拟。 [3] TED 视频中Jim Fan的PPT ： Invalid media:

在Telegram中查看

相关推荐

AI 新知：当GPT-4 遇上开放世界游戏，智能代理到底有多强？

AI 新知：当GPT-4 遇上开放世界游戏，智能代理到底有多强？尽管AI 智能代理在一个开放世界的成为超级玩家的内容不再是新闻了，然而在上周英伟达发布一系列重磅发布中，这个被称为 Voyager 游戏智能代理，还是表现出非常令人惊叹的自主探索和学习能力。这种智能代理是如何通过 GPT-4 一步步是实现的？为了让更多非专业人士，从原理层面感知这类技术（类似 AutoGPT）原理、应用层的可能，我和 Claude 100k 一起为大家尽可能深入浅出的进行解释和案例分析。（对话全部内容，核心问题只有一个，自主学习、编码、技能树的游戏 AI 是如何工作。（如果你不熟悉《我的世界》这款游戏的玩家视角，我建议你先在官方网址，简单看一下多个GIF 级别的小视频，有个感性认知。图 1，也可以直接移步官方网址 Voyager 是什么？ - 它是第一个玩Minecraft的终身学习的智能代理。Voyager 可以自己写代码、自我迭代、不断完善技能库中，实现可以终身学习的游戏探索过程（见图 2 ） - 它建立在GPT-4之上，并解锁了一个新的范式：「训练」在这个语境下是执行代码；「训练模型」是Voyager迭代组成的技能代码库，而不是浮点矩阵。 - Voyager 正在成为一个经验丰富的探索者，一个超级玩家。在《我的世界》中，它获得了3.3倍的独特物品，旅行了2.3倍的距离，解锁关键技术树里程碑的速度比之前的方法快15.3倍。 - 它是开源的。 Voyager 有 3 个关键组件：（见图3） 1. 结合游戏反馈、执行错误、验证来完善程序的迭代提示机制；（让 GPT-4 写代码） 2. 用于存储和检索复杂行为的技能代码库；（任务的自主完善和迭代） 3. 最大化探索的自动课程。（开放的任务指导体系）以下是我和Claude 100k的全文提问内容，你可以作为「深度对话」和 GPT 们交流。（如果你不是 Poe 的付费用户，也可以用 ChatPDF 之类的代替） Q1：我们讨论一篇重要的AI行业论文，我把正文输入给你，当你阅读理解完成后，请回复 OK。（请注意，复制全文有关对话记录省略了）

机器人时代已来黄仁勋指向AI下一波浪潮：物理AI

机器人时代已来黄仁勋指向AI下一波浪潮：物理AI 他着重强调了机器人和AI在未来发展中的重要性“AI的新一波浪潮是物理AI。AI能够理解物理定律，并与人类并肩作战……机器人和物理AI正在成为现实，而不仅是出现在科幻小说中，这真的很让人兴奋。”什么是“物理AI”？物理AI英文为Physical AI，也称“实体AI”。瑞士联邦材料科学与技术实验室Aslan Miriyev和伦敦帝国理工学院Mirko Kovač之前在《Nature MachineIntelligence》发表的一篇文章中，曾如此定义“物理AI”：物理AI是指能够执行通常与智能生物体相关的任务的实体系统，可以实现机体、控制、形态、动作执行和感知的协同进化。在这次演讲中，黄仁勋表示，如今大多数AI并不理解物理定律，不以物质世界为基础。而生成图像、视频、3D图形和许多物理现象，需要基于物理并理解物理定律的AI。“为我们工作的AI，必须理解世界模型，才能理解如何解释世界、如何感知世界。”世界各地的研究人员和公司正在开发由物理AI驱动的机器人，这些AI模型能够理解指令，并在现实世界中自主执行复杂任务。机器人时代已经到来机器人是一个颇为广泛的概念。黄仁勋表示，当他提到“机器人”时，通常大家会想到人形机器人，“但这并不完全正确。一切都将是机器人。”机器人将遍布所有工厂，工厂将实现对机器人的统筹，而这些机器人将制造新的机器人产品。在黄仁勋的构想中，下一个由机器人工厂内的机器人制造的高产量机器人产品可能是人形机器人，最容易适应世界的机器人也是人形机器人。“机器人时代已经到来，AI的下一波浪潮已经到来，”站在各式各样的机器人投影屏幕前，黄仁勋张开双臂，宣告全新时代的揭幕，“由物理AI驱动的机器人技术将彻底改变行业。这不是未来，这正在发生。”在英伟达的产品中，有多项内容与机器人有关，包括用于模拟应用的NVIDIA Omniverse平台、Project GR00T人形机器人通用基础模型、Jetson Thor机器人计算机、NVIDIA Isaac平台等，比亚迪电子、西门子、泰瑞达等公司也正在将英伟达自主机器人技术集成到自家工厂中。英伟达内部也已组建研究小组GEAR，全称Generalist Embodied Agent Research，意为“通用具身智能体研究”。该小组领头人之一、英伟达高级研究科学家Jim Fan彼时也给出了与黄仁勋相似的说法：未来每一台移动的机器都将是自主的，机器人与模拟智能体将和iPhone一样无处不在。“我们正在打造基础智能体：一个具备通用能力的AI，其能在虚拟与现实的多个世界中学习如何熟练行动。2024年将是机器人之年、游戏AI之年、模拟之年。”值得一提的是，随着AI的这一把火从聊天机器人烧向人形机器人，加码投资的自然也不止英伟达一家巨头。上周OpenAI被曝已重启此前被放弃的机器人团队，一位接近OpenAI的知情人士表示，这个新组建的机器人团队已经初步形成，并已经运作了大约两个月的时间。OpenAI副总裁、前机器人团队成员Peter Welinder表示，“我们始终计划重返机器人领域，与Figure AI的合作为我们指明了一条道路，即探索在高性能多模态模型驱动下，人形机器人能够取得的卓越成就。” ... PC版：手机版：

《中国科学技术大学国家基础科学人才培养基地物理学丛书》

《中国科学技术大学国家基础科学人才培养基地物理学丛书》简介：该丛书由权威学术团队编写，系统整合物理学核心理论与前沿进展，注重理论与实践深度融合。内容涵盖从经典力学到量子物理的完整知识体系，配套丰富实验案例与习题，旨在强化逻辑思维与科研能力，为拔尖人才搭建从基础到创新的阶梯。亮点：①顶尖高校教研成果结晶，体系严谨且反映学科动态；②突出数理建模与实验探究能力培养；③每章设置开放性课题，衔接重大科研项目实践；④配备数字化教学资源，支持自主深度学习。标签：#物理学教育 #基础科学拔尖计划 #科教融合 #国家级规划教材 #实验驱动学习链接：https://pan.quark.cn/s/a0c87260b5c9

Q2：请总结这篇论文的核心要点，尽量以中学生能读懂的非技术语言和风格。我们一条条慢慢展开，尽量站在科普和面向非专业人士的立场。

Q2：请总结这篇论文的核心要点，尽量以中学生能读懂的非技术语言和风格。我们一条条慢慢展开，尽量站在科普和面向非专业人士的立场。首先，请你站在非游戏玩家立场上，简单介绍下Minecraft 这个沙盒游戏？为Voyager这样的自组织学习的智能代理有什么独特的环境属性？ Q3：我的理解是，「迭代提示机制」作为第一个核心要素，是Voyager 自组织探索的关键。当VOYAGER 需要完成一个任务时,它会先通过大语言模型生成一段代码；然后根据执行这段代码产生的环境反馈、执行错误和自我验证；不断改进这段代码，直到完成任务要求；得到成功的代码就会加入技能库。能否针对《我的世界》这款游戏玩家的视角，给出一些具体的任务和例子， Voyager是如何执行这条机制和系统的呢？例子不要3个，可以从简单到复杂，尽量包含与环境的互动和反馈等关键描述。注意保持非技术人士的视角。（见图4） Q4：很有趣，以中等难度的「制作铁制工具」任务为例， VOYAGER会如何自组织设计prompts来实现 GPT-4的编码呢？具体有哪些环境属性的信息，让 AI 模型能够「看见」和得到反馈信息？（图 5） Q5：看起来这些 prompts 的方式相当开发者级别呢？不仅包含了包含环境和实体的属性信息，还让游戏的 API 模拟了游戏操作。那么，如何解决GPT-4 编写代码出现 bug，病自动修复的问题呢？（图 6） Q6：除了自我修复 bug，还有「自动课程」机制会触发，提供另外一些新的任务目标。那么，请用最朴实、简明的语言，介绍一下「自动课程」的基本原理，并介绍 3 个场景案例，来探讨它是如何给 AI 智能代理提供新任务的流程？（图 7） Q7：我举一个更具体玩游戏场景的例子：例如 AI 智能代理，发现自己在沙漠而不是森林中，它会如何调整它当前的任务（制作铁锹的材料在当前环境缺失）？ Q8：Voyager通过将成功的程序存储在一个矢量数据库中，逐步建立起一个技能库。每个程序都可以通过其文件串的嵌入来检索。复杂的技能是由较简单的技能合成的，这使Voyager的能力随着时间的推移而不断增强。 Q9：论文中提到，顶部：添加新技能。每个技能都通过嵌入其描述来索引，可以在将来的类似情况下检索。

零技术基础素人的AI网站上线了～！

零技术基础素人的AI网站上线了～！ AI可以为我们做点什么，或者说，普通人如何通过AI让生活变得更好？几个月前ChatGPT大火的时候，我开始思考，如果在人工智能的加持下，技术、艺术和文字创作都不再是问题，也许最受益的是产品经理。发现问题，有创造力地解决问题，并将问题的答案以大家能接受且喜欢的方式呈现，是不被淘汰的、最宝贵的技能。于是我将AI和零代码工具作为大脑背后强有力的队伍，花了两天时间做了nomadvisas.info这个网站（见下方链接），为数字游民提供签证信息和一个网络tribe和栖息地。 nomadvisas.info背后的队伍：指挥官：我出谋划策的高级顾问：ChatGPT 能满足我挑剔需求的文案：ChatGPT 图像/摄影：midjourney & DALL.E 网站制作：Wix 收入模式：Google AdSense 小机器人协调官：我欢迎大家光临我的网站，给反馈或是任何其他AI创作的灵感谢谢哒嘎！

《零基础感受韩语的魅力》

《零基础感受韩语的魅力》简介：从发音规则到基础语法，通过生活化场景带您轻松迈入韩语世界。课程融入K-pop歌词解析、韩剧经典对白练习等趣味环节，帮助学习者在三个月内掌握自我介绍、购物点餐等日常交流技能，同步了解韩国社会礼仪文化。亮点：系统音标教学法解决发音痛点；实景对话模块覆盖八大生活主题；韩流文化专题增加学习趣味性；配套AI语音测评实时纠正语调。标签：#韩语入门 #趣味教学 #K-pop文化 #生活韩语 #语音识别 #30天挑战 #首尔大学教材链接：https://pan.quark.cn/s/1df6a7dc7b26

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人

相关推荐

AI 新知：当GPT-4 遇上开放世界游戏， 智能代理到底有多强？

机器人时代已来 黄仁勋指向AI下一波浪潮：物理AI

《中国科学技术大学国家基础科学人才培养基地物理学丛书 》