Deepmind 推出了一个可以自我改进的AI机器人代理:

Deepmind 推出了一个可以自我改进的AI机器人代理: 它能自我学习并在不同的机械臂上执行各种任务,而且还能自我生成新的训练数据以改进其技术。 RoboCat的学习速度非常快。只需要观察100次左右的演示,就可以学会操控机械臂来完成各式各样的任务,并且它还能通过自生成的数据来进行迭代改进。 RoboCat的一些主要特点: 1、多任务和自适应能力:RoboCat是第一个能够解决和适应多个任务,并在不同的真实机器人上执行这些任务的代理。 2、快速学习:RoboCat的学习速度比其他最先进的模型快得多。它可以通过观察少至100个示例来学习新任务,因为它从大型多样化的数据集中获取信息。这将有助于加速机器人研究,因为它减少了对人工监督训练的需求,这是创建通用机器人的重要步骤。 3、自我改进:RoboCat基于Deepmind的多模型模型Gato,它可以在模拟和物理环境中处理语言、图像和动作。将Gato的架构与大型训练数据集结合起来,该数据集包含了各种机器人臂解决数百种不同任务的图像和动作序列。 4、操作新的机器人臂和解决更复杂的任务:通过RoboCat的多样化训练,它在几个小时内学会了操作不同的机器人臂。虽然它已经在两爪夹具的臂上进行了训练,但它能够适应更复杂的臂,这种臂有三个手指的夹具和两倍的可控输入。 5、自我改进的通才:RoboCat有一个训练的良性循环:它学习的新任务越多,它在学习其他新任务上就越好。最初版本的RoboCat在以前未见过的任务上的成功率只有36%,这是在每个任务上从500个示例中学习后的结果。但是最新的RoboCat,在对更多任务进行了训练后,将这个成功率提高了一倍多。

相关推荐

封面图片

DeepMind 推出“足球运动员”智能体机器人

DeepMind 推出“足球运动员”智能体机器人 Google DeepMind 研发的具身智能体(agent)微型人形机器人,不仅可以快速“奔跑”“过人”“进攻”,还可以阅读比赛,正确预测足球移动方向,以及阻挡对手射门等,并且可以在现实环境中进行对抗。使用深度强化学习训练低成本的现成机器人踢多机器人足球,机器人在训练后展现出的敏捷性和流畅性远超期望。智能体也涌现出了一些意想不到的策略,这些策略比脚本策略更充分地利用了系统的全部功能,而这些策略可能是人类根本没有想到的。该研究以4月封面文章的形式已发表在 Science Robotics 上,题为“利用深度强化学习让双足机器人掌握敏捷足球技能”。 视频中左侧为具有学习能力的机器人,右侧是作为参照以脚本编程的机器人。 ,

封面图片

DeepMind 的深度强化学习足球机器人

DeepMind 的深度强化学习足球机器人 在 MuJoCo 物理引擎中进行模拟训练,再转移进真实机器人。可以无缝做出抢断、起身、踢球和追球动作,还对比赛有了基本的战略理解,学习预测球的运动和阻挡对手的射门。

封面图片

用于机器人学习和具身AI领域研究的模块化框架

用于机器人学习和具身AI领域研究的模块化框架 RoboHive 生态系统包含一系列预先存在的和新颖的环境,包括 Shadow Hand 的灵巧操纵、Franka 和 Fetch 机器人的全臂操纵任务以及各种四足运动任务。 与之前的作品相比,RoboHive 提供了精简且统一的任务界面,利用最新的模拟绑定,具有丰富的视觉多样性任务,并支持现实世界开发的通用硬件驱动程序。 RoboHive 的统一界面为研究人员提供了一个方便且易于访问的平台来研究多种学习范式,例如模仿、强化、多任务和分层学习。 RoboHive 还包括大多数环境的专家演示和基线结果,为基准测试和比较提供了标准。 特征: 最广泛、多样化的任务集合 完全可定制的视觉丰富的任务,专为行为泛化而设计。 奖励不可知的任务成功指标 支持多种算法系列+预训练基线 Sim 和硬件无关的机器人类,可在 sim <> real 之间轻松转换 远程操作支持。人类+专家数据集 | #框架

封面图片

谷歌 DeepMind 正在使用 Gemini 来训练机器人使其变得更聪明

谷歌 DeepMind 正在使用 Gemini 来训练机器人使其变得更聪明 谷歌正在使用 Gemini AI 训练其机器人,以便它们能够更好地导航和完成任务,DeepMind 机器人团队在一篇新的研究论文中解释了如何使用 Gemini 1.5 Pro 的长上下文窗口,让用户可以使用自然语言指令更轻松地与其 RT-2 机器人进行交互。 其工作原理是拍摄指定区域的视频,研究人员使用 Gemini 1.5 Pro 让机器人“观看”视频以了解环境,然后机器人可以根据情况执行命令。 DeepMind 表示其 Gemini 驱动的机器人在超过 50 个任务中的成功率高达 90%。研究人员还发现“初步证据”表明,Gemini 使其机器人能够计划如何执行导航以外的指令,例如,当办公桌上有很多可乐罐的用户询问机器人“是否有他们最喜欢的饮料”时,Gemini 就会知道“机器人应该导航到冰箱,检查是否有可乐,然后返回给用户报告结果。”DeepMind 表示计划进一步调查这些结果。 ,

封面图片

英伟达发布新的机器人制造平台 添加生成式AI功能

英伟达发布新的机器人制造平台 添加生成式AI功能 生成式AI的加入将使人形机器人根据语言、视频、“人类示范”和过去的经验相结合的输入采取行动。这个被称为“GR00T项目”的生成式AI组件将添加到英伟达现有的机器人硬件和软件平台上。英伟达Omniverse和仿真技术副总裁Rev Lebaredian在新闻发布会上说:“这些更智能、更快、更好的机器人将被部署在全球的重工业中。我们正在与全球整个机器人和仿真生态系统合作,以加速开发和采用。”新的生成式AI软件背后的强大计算机被称为“杰森·索尔”(Jetson Thor),基于英伟达的一款人工智能芯片和其他硬件。该公司表示,这台计算机将为机器人提供足够的计算能力,以执行复杂的任务,并与人和机器互动。英伟达表示,这套软件工具被称为“艾萨克”(Isaac)平台,新的GR00T生成式AI功能被设计用于“任何环境下的任何机器人化身”。这些工具包括训练软件随着时间的推移做出更好决策的能力,这一过程被称为强化学习。英伟达还表示,将发布预先训练过的机器人模型和其他软件,以改进机械臂功能和多摄像头感应能力。 ... PC版: 手机版:

封面图片

波士顿动力公司、OpenAi、特斯拉、Google DeepMind 联合推出了第一个Figure 1 机器人,并计划生产 10

波士顿动力公司、OpenAi、特斯拉、Google DeepMind 联合推出了第一个Figure 1 机器人,并计划生产 10 亿个、这是批量生产的模型、机器人可以交流,里面装了ChatGPT,学习速度非常快。 吃瓜俱乐部 @ChiGuaClub

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人