瑜伽球上训练出来的机器狗比大多数健身者更能灵活运用训练资源

瑜伽球上训练出来的机器狗比大多数健身者更能灵活运用训练资源 DrEureka是一个任何人都可以获取的开源软件包,用于使用大型语言模型(LLM)(如ChatGPT 4)训练机器人执行现实世界中的任务。这是一个"模拟到现实"系统,也就是说,它在虚拟环境中使用模拟物理原理对机器人进行教学,然后再在现实空间中实施。吉姆-范(Jim Fan)博士是 DrEureka 的开发者之一,他部署的 Unitree Go1 四足机器人一跃成为头条新闻。这是一款"低成本"、支持良好的开源机器人这很方便,因为即使有了人工智能,机器人宠物仍然很容易摔伤。至于"低成本",它在亚马逊上的售价为 5899 美元,评分为 1 星……DrEureka 中的"Dr"代表"领域随机化",即在模拟环境中随机化摩擦、质量、阻尼、重心等变量。只需在 ChatGPT 等 LLM 中输入一些提示,人工智能就能编写代码,创建一个奖励/惩罚系统,在虚拟空间中训练机器人,其中 0 = 失败,高于 0 则为胜利。得分越高越好。它可以通过最小化和最大化球的弹跳力、运动强度、肢体自由度和阻尼等方面的失效点/爆发点来创建参数。作为一个 LLM,它可以毫不费力地大量创建这些参数,供训练系统同时运行。每次模拟后,GPT 还可以反思虚拟机器人的表现,以及如何改进。如果超出或违反参数,例如电机过热或试图以超出其能力的方式衔接肢体,都将导致 0 分...没有人喜欢得零分,人工智能也不例外。提示 LLM 编写代码需要安全指令否则,研究小组发现 GPT 会努力追求最佳性能,会在没有指导的情况下在模拟中"作弊"。这在模拟中没有问题,但在现实生活中可能会导致电机过热或肢体过度伸展,从而损坏机器人研究人员称这种现象为"退化行为"。虚拟机器人自学成才的非自然行为的一个例子是,它发现自己可以更快地移动,方法是将臀部插入地面,用三只脚拖着臀部在地板上窜来窜去。虽然这在模拟中是一种优势,但当机器人在现实世界中尝试时就尴尬了。因此,研究人员指示 GPT 要格外小心,因为机器人将在真实世界中接受测试为此,GPT 创建了安全功能,如平滑动作、躯干方向、躯干高度,并确保机器人的电机不会扭矩过大。如果机器人作弊,违反了这些参数,其奖励函数就会降低得分。安全功能可以减少退化和不自然的行为,比如不必要的骨盆推力。那么它的表现如何呢?比我们强。DrEureka 在训练机器人"pooch"的过程中击败了人类,在实际的混合地形中,它的前进速度和行进距离分别提高了 34% 和 20%。DrEureka 基于 GPT 的训练系统在现实世界中轻松击败人类训练的机器人如何做到?研究人员认为,这与教学方式有关。人类倾向于课程式的教学环境把任务分解成一个个小步骤,并试图孤立地解释它们,而 GPT 能够有效地一次性传授所有知识。这是我们根本无法做到的。DrEureka 是同类产品中的首创。它能够从模拟世界"零距离"进入现实世界。想象一下,在对周围世界几乎一无所知的情况下,你被推出巢穴,只能自己摸索。这就是"零镜头"。DrEureka 的创造者认为,如果他们能向 GPT 提供真实世界的反馈,就能进一步改进模拟到现实的训练。目前,所有的模拟训练都是利用机器人自身本体感觉系统的数据完成的,但如果 GPT 能够通过真实世界的视频画面看到出错的地方,而不是仅仅从机器人的日志中读取执行失败的信息,那么它就能更有效地完善自己的指令。人类平均需要一年半的时间才能学会走路,而大概只有百分之一的人类能在瑜伽球上学会走路。您可以在这里观看一段未经剪辑的 4 分 33 秒视频,视频中机器人狗狗轻松在瑜伽球上散步,且没有停下来在消防栓上撒尿: ... PC版: 手机版:

相关推荐

封面图片

《大多数 Nobody Build.10014949 - 10051》| 简介:大多数 Nobody Build.1001494

《大多数 Nobody Build.10014949 - 10051》| 简介:大多数 Nobody Build.10014949 - 10051 深度模拟了普通人的生活。玩家在游戏里将化身为社会中的一员,面临着求职的艰辛、生活成本的压力以及社交关系的维护等现实问题。在求职过程中,需要根据自身能力和兴趣选择合适的工作,努力提升工作技能以获得晋升机会。在生活中,要合理安排收支,应对各种突发状况。社交方面,要与邻居、同事、朋友建立和维持良好关系。通过努力克服重重困难,玩家能全方位地感受到真实的人生百态,体验平凡生活中的酸甜苦辣。| 文件大小 NG | 链接: |标签: #大多数 Nobody #生活模拟 #人生百态 #求职社交 #现实体验

封面图片

首个自主完成人类任务机器人出现:五指灵活速度超人 大模型加持虚拟空间训练

首个自主完成人类任务机器人出现:五指灵活速度超人 大模型加持虚拟空间训练 而特斯拉的擎天柱也屡屡传出好消息。没人怀疑,今年会是人形机器人爆发的一年。一家位于加拿大的机器人公司Sanctuary AI最近发布了一款全新的人形机器人Phoenix。官方号称它能以和人类一样的速率自主完成很多工作。世界上第一台能以人类速度自主完成任务的机器人Pheonix可以轻轻地抓取、移动并优雅地将每个对象放置在它的左右两侧。它可以自主地识别物体的颜色,将不同颜色的物体分开放置,整个过程非常丝滑,速度确实和人类差不多。时代周刊在将Phoenix评为了2023年的最佳发明,说明了主流的大众媒体对他们的认可。Phoenix由先进且独特的人工智能系统 Carbon 来控制,身高1米7,重155磅,拥有行业最领先的机器手,可与人类手的灵活性和精细操作相媲美。Carbon融合现代人工智能技术,将自然语言转化为现实世界的行动,具有可解释、可审查的推理能力,负责规划任务和运动计划,使得Phoenix能像人一样思考、行动,从而完成工作任务。它的工作负载可以达到25公斤,并且能以5公里每小时的速度进行移动。有网友做了一个统计所有机器人公司产品向人类“进化”的进度的表格,可以看出,头部几家公司已经能够完成自主的工作任务了。而要完成精细的工作任务,主要的难点就在于手部的灵活性和控制技术上。根据Sanctuary AI的演示,现在机器人已经可以自主完成很多简单的工作了。检查试管。将螺丝和螺母分类。将物品放入瓶子中。对物品进行扫码识别。还可以自主完成像人类一样的叠方块游戏。训练方式:从远程遥控数据中自主学习Sanctuary AI 使用远程操作对Pheonix 进行训练。工作人员通过VR系统,操纵机器人的四肢、手和手指完成各种任务。然后,将操作过程中的数据放在一个模拟的系统中,对机器人进行训练。而为了实现训练之后的动作,并且同时让机器人的动作能够达到迅速,有力,而且精准,他们选择了液压系统来完成对于机器人的操控。根据CTO Gildert的说法,只有液压系统能够让机器人“做一些非常灵巧的事情,比如穿针、扣纽扣之类的,你必须问自己,那只手还能举起一个 50 磅重的手提箱,并且以人类速度在键盘上打字。”在去年3月份,他们把机器人放到了温哥华的一个超市中,让它完成了110项与零售相关的任务。这包括挑选和包装商品、贴标签、贴标签、折叠和清理商店。公司核心创始人CEO:Geordie Rose他是一名科技行业的连续创业者。在2018年创立Sanctuary AI之前,他曾经创立了2家高科技公司:Kindred.ai:世界上第一家制造能在生产环境中使用的强化学习的机器人公司。D-Wave Systems Inc.:世界上第一家量子计算公司,向Google、美国宇航局、洛克希德·马丁公司、Gap Inc. 和几个美国政府机构出售量子计算机。他是不列颠哥伦比亚大学理论物理学博士。他还是一名搏击运动员,曾经是两届加拿大国家摔跤冠军,并且是 2010年NAGA大师白带巴西柔术世界锦标赛道道和无道类别的冠军。CTO:Suzanne Gildert她之前和CEO一起,在D-Wave和Kindred都担任重要职务。在加入Sanctuary之前,Suzanne是Kindred AI的联合创始人。她负责监督公司类人机器人的设计和工程,并负责开发认知架构,使机器人能够了解自己及其环境。在D-Wave期间,Suzanne开发了MAXCAT世界上第一个针对量子计算机的游戏,开发了世界上第一个在量子计算机上运行的监督分类器,并且是第一个使用量子计算机控制机器人运动的人。她毕业于伯明翰大学,研究方向是实验量子物理。他们两人同时也在网上定期发布与技术有关的播客,涉及内容从公司的治理到公司的具体技术细节,如果对人形机器人有兴趣的话千万不要错过他们的精彩内容。 ... PC版: 手机版:

封面图片

一个基于 Nvidia Isaac Gym 的易于使用的强化学习 (RL) 框架,旨在训练人形机器人的运动技能,强调从模拟到现实

一个基于 Nvidia Isaac Gym 的易于使用的强化学习 (RL) 框架,旨在训练人形机器人的运动技能,强调从模拟到现实环境的零样本迁移。Humanoid-Gym还集成了从Isaac Gym到Mujoco的sim-to-sim框架,允许用户在不同的物理模拟中验证训练好的策略,以确保策略的鲁棒性和泛化性。 该代码库由 RobotEra 的 XBot-S(1.2 米高的人形机器人)和 XBot-L(1.65 米高的人形机器人)在现实环境中进行了验证,具有零样本模拟到真实的传输。 | #框架

封面图片

ℹGPT4All 在电脑本地安装类似 ChatGPT 的聊天机器人,提供超多 LLM,无需连网和 GPU 就能用#

ℹGPT4All 在电脑本地安装类似 ChatGPT 的聊天机器人,提供超多 LLM,无需连网和 GPU 就能用# 对于有在使用 AI 聊天机器人的读者来说,一定想试试看能不能在本地安装 LLM 大语言模型,这样即便没有网路也能使用,而这篇要介绍的 GP...

封面图片

“机器人正在接管旧金山”

“机器人正在接管旧金山” 路线不对,踩着小碎步,稳步调头:或者不装了,调什么头,直接倒着走:在各种场景下都可以看到它们的身影:于是乎,网友传出了“机器人正在接管旧金山”的消息??:要不是视频中还有人类出镜,网友都要怀疑这是不是真的在旧金山:这就是来自加州大学伯克利分校的人形机器人成果。研究人员提出了使用序列建模和动作预测的Causal Transformer模型。使得人形机器人可以在室内外各种环境中稳健行走,应对不同地形,甚至还能背个书包,提袋垃圾:怎么做到的?此前,尽管一些人形机器人在特定环境下表现良好,但广泛存在泛化和适应新环境方面的问题。来自加州大学伯克利分校的研究人员提出了运用Causal Transformer的方法。这是一种Transformer模型,通过自回归从观察-动作历史信息中预测下一个动作,也就是模型的输出(预测的动作)只依赖于其输入(观察-动作历史信息)中的先前信息。具体来说,在处理“观察-动作对”时,模型会将每个“观察-动作对”作为一个token,并通过自注意力机制来学习这些token之间的关系。在自注意力计算中,模型会为每个token分配权重,这些权重反映了在预测当前动作时,序列中其他token的重要性。由于Causal Transformer限制了自注意力只能考虑前面的token,它能够捕捉到序列中的因果依赖,即当前动作的决策是基于之前观察-动作的历史信息。通过这种方式,Causal Transformer能够使机器人在复杂和动态的环境中,在没有未来信息的情况下做出适应性更强的决策。训练阶段,研究人员使用强化学习方法,在Isaac Gym模拟器进行大规模并行训练,模拟了机器人的刚体和接触动力学。为了模拟机器人的闭链动力学,引入了“虚拟弹簧”模型。在模拟中随机化机器人的动态属性、控制参数和环境物理属性,以及添加噪声和延迟到观察中。从模拟到现实的转移方面,研究人员在机器人初创公司Agility Robotics提供的高保真度模拟器中验证策略,该模拟器准确模拟了Digit机器人的动态和物理属性。经过实验,Digit机器人能够在多种环境中可靠行走,展现出对外部干扰的鲁棒性:以及在不同地形和载荷条件下的适应性:△左,脚被绊住;右,下坡顺带保持手臂摆动协调有力,不顺拐:Digit人形机器人再来介绍一下demo中的这款人形机器人Digit。背后公司Agility Robotics,前身为俄勒冈州立大学的Dynamic Robotics Laboratory。2022年,获亚马逊投资。Agility Robotics的主要产品是以鸵鸟等鸟类为发想的双足步行机器人,主要研发成果包含Cassie、Digit两个机型。其中Cassie是只有下半身的双足机器人:至于Digit,像是下面这个,已经成为亚马逊75万机器人员工中的一员,不过还处于测试阶段,负责搬运亚马逊标志性的黄箱子:Agility Robotics表示,将在今年向合作伙伴交付第一批Digit,Digit的初步应用包括仓库和配送中心内的散装材料处理,预计2025年全面上市。他们最近还宣布开设了一家新机器人制造工厂RoboFab?,声称第一年预计生产数百台机器人,之后每年产能最多可达10000台。Digit也将在新工厂中上岗,进行搬运、装载等工作。 ... PC版: 手机版:

封面图片

AI 新知:为什么基础代理将会是下一个革命性技术?

AI 新知:为什么基础代理将会是下一个革命性技术? 来自英伟达高级研究员 & AI Agents负责人Jim Fan 近期释放的TED 演讲,《The next grand challenge for AI》提出了「基础代理」将在虚拟世界和物理世界中无缝运行。他解释了这项技术将如何从根本上改变我们的生活渗透到从视频游戏、元宇宙到无人机和仿人机器人的方方面面并探讨了这一模型如何掌握跨越这些不同现实的技能。 他提出「基础代理」(Foundation Agent)的秘诀:一个单一的模型,可以学习如何在不同的世界中行动。 (如果你之前不太熟悉AI agents相关基础知识, 可以结合文本内容补充相关知识点,Enjoy) 「基础代理」中的智能体, Voyager 是什么?? - 它是一个在 Minecraft开放世界中无限学习的智能体。Voyager 可以自己写代码、自我迭代、不断完善技能库中,实现无限学习(Longlife learning)的探索过程。 - 这里核心只有一个,就是无限迭代。 它不断扩充自己的技能图书馆, 无论是在游戏中制作工具,并升级科技树(例如,从Wooden Tool 到Iron Tool), 全部是自主迭代、自主验证的。 它不仅是自动化,它是通过一套机制自主学习 [1]。 - 它建立在GPT-4之上,并解锁了一个新的范式:「训练」在这个语境下是执行代码;「训练模型」是Voyager迭代组成的技能代码库,而不是浮点矩阵。 - Voyager 作为一个超级玩家,在《我的世界》中,它获得了3.3倍的独特物品,旅行了2.3倍的距离,解锁关键技术树里程碑的速度比之前的方法快15.3倍。它还开源的。 [1] 为什么这个「基础代理」具有非凡意义? - LLM 适用于大量文本,而基础代理可以跨越很多很多现实。 基础代理 已经在虚拟世界被验证强大的学习自主性。 - 其次,Jim Fan 认为它具有跨越Reality的拓展性。 开放游戏世界Minecraft 只是作为一个模拟现实(simulated realities)和实验基地,他们还在其他仿真环境进行训练和探索得到惊人进展。[2] - 如果它能够掌握 10,000 种不同的模拟现实,那么它就能很好地推广到我们的物理世界,而物理世界只是第 10,001 个现实。 - 换句话说,它正在加速应用于物理世界,特别是机器人技术。 参考Jim Fan的PPT 。 [3] Hans 注释: [1] 这套自主学习和迭代的机制,有三个核心组件: a)结合游戏反馈、执行错误、自我验证来完善程序的迭代提示机制;(让 GPT-4 写代码 ) b)用于存储和检索复杂行为的技能代码库;(任务的完善和迭代,成为了技能) c)最大化探索的自动课程。Hans 在去年相关论文讨论的《当GPT-4 遇上开放世界》中,有更详细的解读。 [2] 英伟达 Isaac Gym 是一个功能强大的端到端 GPU 加速仿真环境,用于强化学习,可用于训练机器人和模型。它是英伟达 Omniverse 平台的一部分,为机器人和计算机视觉算法提供基于物理的高保真模拟。 [3] TED 视频中Jim Fan的PPT : Invalid media:

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人