瑜伽球上训练出来的机器狗比大多数健身者更能灵活运用训练资源

瑜伽球上训练出来的机器狗比大多数健身者更能灵活运用训练资源 DrEureka是一个任何人都可以获取的开源软件包,用于使用大型语言模型(LLM)(如ChatGPT 4)训练机器人执行现实世界中的任务。这是一个"模拟到现实"系统,也就是说,它在虚拟环境中使用模拟物理原理对机器人进行教学,然后再在现实空间中实施。吉姆-范(Jim Fan)博士是 DrEureka 的开发者之一,他部署的 Unitree Go1 四足机器人一跃成为头条新闻。这是一款"低成本"、支持良好的开源机器人这很方便,因为即使有了人工智能,机器人宠物仍然很容易摔伤。至于"低成本",它在亚马逊上的售价为 5899 美元,评分为 1 星……DrEureka 中的"Dr"代表"领域随机化",即在模拟环境中随机化摩擦、质量、阻尼、重心等变量。只需在 ChatGPT 等 LLM 中输入一些提示,人工智能就能编写代码,创建一个奖励/惩罚系统,在虚拟空间中训练机器人,其中 0 = 失败,高于 0 则为胜利。得分越高越好。它可以通过最小化和最大化球的弹跳力、运动强度、肢体自由度和阻尼等方面的失效点/爆发点来创建参数。作为一个 LLM,它可以毫不费力地大量创建这些参数,供训练系统同时运行。每次模拟后,GPT 还可以反思虚拟机器人的表现,以及如何改进。如果超出或违反参数,例如电机过热或试图以超出其能力的方式衔接肢体,都将导致 0 分...没有人喜欢得零分,人工智能也不例外。提示 LLM 编写代码需要安全指令否则,研究小组发现 GPT 会努力追求最佳性能,会在没有指导的情况下在模拟中"作弊"。这在模拟中没有问题,但在现实生活中可能会导致电机过热或肢体过度伸展,从而损坏机器人研究人员称这种现象为"退化行为"。虚拟机器人自学成才的非自然行为的一个例子是,它发现自己可以更快地移动,方法是将臀部插入地面,用三只脚拖着臀部在地板上窜来窜去。虽然这在模拟中是一种优势,但当机器人在现实世界中尝试时就尴尬了。因此,研究人员指示 GPT 要格外小心,因为机器人将在真实世界中接受测试为此,GPT 创建了安全功能,如平滑动作、躯干方向、躯干高度,并确保机器人的电机不会扭矩过大。如果机器人作弊,违反了这些参数,其奖励函数就会降低得分。安全功能可以减少退化和不自然的行为,比如不必要的骨盆推力。那么它的表现如何呢?比我们强。DrEureka 在训练机器人"pooch"的过程中击败了人类,在实际的混合地形中,它的前进速度和行进距离分别提高了 34% 和 20%。DrEureka 基于 GPT 的训练系统在现实世界中轻松击败人类训练的机器人如何做到?研究人员认为,这与教学方式有关。人类倾向于课程式的教学环境把任务分解成一个个小步骤,并试图孤立地解释它们,而 GPT 能够有效地一次性传授所有知识。这是我们根本无法做到的。DrEureka 是同类产品中的首创。它能够从模拟世界"零距离"进入现实世界。想象一下,在对周围世界几乎一无所知的情况下,你被推出巢穴,只能自己摸索。这就是"零镜头"。DrEureka 的创造者认为,如果他们能向 GPT 提供真实世界的反馈,就能进一步改进模拟到现实的训练。目前,所有的模拟训练都是利用机器人自身本体感觉系统的数据完成的,但如果 GPT 能够通过真实世界的视频画面看到出错的地方,而不是仅仅从机器人的日志中读取执行失败的信息,那么它就能更有效地完善自己的指令。人类平均需要一年半的时间才能学会走路,而大概只有百分之一的人类能在瑜伽球上学会走路。您可以在这里观看一段未经剪辑的 4 分 33 秒视频,视频中机器人狗狗轻松在瑜伽球上散步,且没有停下来在消防栓上撒尿: ... PC版: 手机版:

相关推荐

封面图片

《大多数 Nobody Build》

《大多数 Nobody Build》 一款深度模拟底层生活的游戏,真实还原打工人的艰辛与奋斗,引发玩家对现实的思考。 #生存模拟#大多数NobodyBuild#PC平台 2025-07-08 00:34:56 https://pan.quark.cn/s/d67c02306b7d

封面图片

一个基于 Nvidia Isaac Gym 的易于使用的强化学习 (RL) 框架,旨在训练人形机器人的运动技能,强调从模拟到现实

一个基于 Nvidia Isaac Gym 的易于使用的强化学习 (RL) 框架,旨在训练人形机器人的运动技能,强调从模拟到现实环境的零样本迁移。Humanoid-Gym还集成了从Isaac Gym到Mujoco的sim-to-sim框架,允许用户在不同的物理模拟中验证训练好的策略,以确保策略的鲁棒性和泛化性。 该代码库由 RobotEra 的 XBot-S(1.2 米高的人形机器人)和 XBot-L(1.65 米高的人形机器人)在现实环境中进行了验证,具有零样本模拟到真实的传输。 | #框架

封面图片

首个自主完成人类任务机器人出现:五指灵活速度超人 大模型加持虚拟空间训练

首个自主完成人类任务机器人出现:五指灵活速度超人 大模型加持虚拟空间训练 而特斯拉的擎天柱也屡屡传出好消息。没人怀疑,今年会是人形机器人爆发的一年。一家位于加拿大的机器人公司Sanctuary AI最近发布了一款全新的人形机器人Phoenix。官方号称它能以和人类一样的速率自主完成很多工作。世界上第一台能以人类速度自主完成任务的机器人Pheonix可以轻轻地抓取、移动并优雅地将每个对象放置在它的左右两侧。它可以自主地识别物体的颜色,将不同颜色的物体分开放置,整个过程非常丝滑,速度确实和人类差不多。时代周刊在将Phoenix评为了2023年的最佳发明,说明了主流的大众媒体对他们的认可。Phoenix由先进且独特的人工智能系统 Carbon 来控制,身高1米7,重155磅,拥有行业最领先的机器手,可与人类手的灵活性和精细操作相媲美。Carbon融合现代人工智能技术,将自然语言转化为现实世界的行动,具有可解释、可审查的推理能力,负责规划任务和运动计划,使得Phoenix能像人一样思考、行动,从而完成工作任务。它的工作负载可以达到25公斤,并且能以5公里每小时的速度进行移动。有网友做了一个统计所有机器人公司产品向人类“进化”的进度的表格,可以看出,头部几家公司已经能够完成自主的工作任务了。而要完成精细的工作任务,主要的难点就在于手部的灵活性和控制技术上。根据Sanctuary AI的演示,现在机器人已经可以自主完成很多简单的工作了。检查试管。将螺丝和螺母分类。将物品放入瓶子中。对物品进行扫码识别。还可以自主完成像人类一样的叠方块游戏。训练方式:从远程遥控数据中自主学习Sanctuary AI 使用远程操作对Pheonix 进行训练。工作人员通过VR系统,操纵机器人的四肢、手和手指完成各种任务。然后,将操作过程中的数据放在一个模拟的系统中,对机器人进行训练。而为了实现训练之后的动作,并且同时让机器人的动作能够达到迅速,有力,而且精准,他们选择了液压系统来完成对于机器人的操控。根据CTO Gildert的说法,只有液压系统能够让机器人“做一些非常灵巧的事情,比如穿针、扣纽扣之类的,你必须问自己,那只手还能举起一个 50 磅重的手提箱,并且以人类速度在键盘上打字。”在去年3月份,他们把机器人放到了温哥华的一个超市中,让它完成了110项与零售相关的任务。这包括挑选和包装商品、贴标签、贴标签、折叠和清理商店。公司核心创始人CEO:Geordie Rose他是一名科技行业的连续创业者。在2018年创立Sanctuary AI之前,他曾经创立了2家高科技公司:Kindred.ai:世界上第一家制造能在生产环境中使用的强化学习的机器人公司。D-Wave Systems Inc.:世界上第一家量子计算公司,向Google、美国宇航局、洛克希德·马丁公司、Gap Inc. 和几个美国政府机构出售量子计算机。他是不列颠哥伦比亚大学理论物理学博士。他还是一名搏击运动员,曾经是两届加拿大国家摔跤冠军,并且是 2010年NAGA大师白带巴西柔术世界锦标赛道道和无道类别的冠军。CTO:Suzanne Gildert她之前和CEO一起,在D-Wave和Kindred都担任重要职务。在加入Sanctuary之前,Suzanne是Kindred AI的联合创始人。她负责监督公司类人机器人的设计和工程,并负责开发认知架构,使机器人能够了解自己及其环境。在D-Wave期间,Suzanne开发了MAXCAT世界上第一个针对量子计算机的游戏,开发了世界上第一个在量子计算机上运行的监督分类器,并且是第一个使用量子计算机控制机器人运动的人。她毕业于伯明翰大学,研究方向是实验量子物理。他们两人同时也在网上定期发布与技术有关的播客,涉及内容从公司的治理到公司的具体技术细节,如果对人形机器人有兴趣的话千万不要错过他们的精彩内容。 ... PC版: 手机版:

封面图片

谷歌 DeepMind 正在使用 Gemini 来训练机器人使其变得更聪明

谷歌 DeepMind 正在使用 Gemini 来训练机器人使其变得更聪明 谷歌正在使用 Gemini AI 训练其机器人,以便它们能够更好地导航和完成任务,DeepMind 机器人团队在一篇新的研究论文中解释了如何使用 Gemini 1.5 Pro 的长上下文窗口,让用户可以使用自然语言指令更轻松地与其 RT-2 机器人进行交互。 其工作原理是拍摄指定区域的视频,研究人员使用 Gemini 1.5 Pro 让机器人“观看”视频以了解环境,然后机器人可以根据情况执行命令。 DeepMind 表示其 Gemini 驱动的机器人在超过 50 个任务中的成功率高达 90%。研究人员还发现“初步证据”表明,Gemini 使其机器人能够计划如何执行导航以外的指令,例如,当办公桌上有很多可乐罐的用户询问机器人“是否有他们最喜欢的饮料”时,Gemini 就会知道“机器人应该导航到冰箱,检查是否有可乐,然后返回给用户报告结果。”DeepMind 表示计划进一步调查这些结果。 ,

封面图片

机器未来3-5年智能化所需的能力

机器未来3-5年智能化所需的能力 模拟:模型能加速模拟环境开发,连接3D开发人员,构建场景、环境,生成资产。这些GenAI资产能广泛应用于合成数据生成、机器人技能训练和软件测试; 多模态大模型接入:基于Transformer的模型能帮助机器人更好地理解周围世界,让它们可以在更多环境中工作,完成复杂任务。 机器人(重新)编程:能更简单地用简单语言定义任务和功能,让机器人更加通用和多用途,通用机器人永远要和场景适配 执行:为了提高效率,结合新颖的机械设计,比如末端执行器\灵巧手(目前成本比较高可控性还不够)提升使用工具的能力 #AI #机器人

封面图片

机器人ChatGPTFreeBot

机器人ChatGPTFreeBot 机器人功能:AI聊天 机器人简介:一款可以进行AI聊天的TG机器人。 不只有AI聊天功能,还有AI绘画功能。投稿者说是GPT4,KK表示怀疑,毕竟GPT4是烧钱的东西,大家可以去测下。 机器人ID:@ChatGPTpandBot 频道 群聊 投稿 商务

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人