ℹ丰田研究所的机器人透过大型行为模型LBMs已经能够做到60种以上的复杂动作#

ℹ丰田研究所的机器人透过大型行为模型LBMs已经能够做到60种以上的复杂动作# 丰田的研究人员表示他们正在为机器人建立「大型行为模型(Large Behavior Models, LBMs)」。与大型语言模型的训练方式...

相关推荐

封面图片

:一个能够执行 ChatGPT 指令的仿人机器人

:一个能够执行 ChatGPT 指令的仿人机器人 东京大学的研究人员成功将仿人机器人 Alter3 与 GPT-4 连接。他们利用指令让这个机器人完成了一系列的人类行为,例如弹吉他、自拍、扮演鬼魂角色,甚至在电影院偷吃别人的爆米花。 这一过程可以看作是一场现代化的“哑剧游戏”:大语言模型 (Large Language Model) 将书面指令转换为可执行的代码,从而让机器人能够模仿出多种人类的动作。

封面图片

MIT博士让机器人自学“常识”:大模型加持 可自主完成复杂家务劳动

MIT博士让机器人自学“常识”:大模型加持 可自主完成复杂家务劳动 相关研究论文以“Grounding Language Plans in Demonstrations Through Counterfactual Perturbations”为题,以会议论文的形式已发表在人工智能(AI)顶会 ICLR 2024 上。麻省理工学院(MIT)电气工程和计算机科学系博士 Yanwei Wang 为该研究论文的通讯作者。他表示,模仿学习是实现家用机器人的主流方法。但是,如果机器人盲目地模仿人类的运动轨迹,微小的错误就会不断累积,最终导致执行过程中的其他错误。“有了我们的方法,机器人就能自我纠正执行错误,提高整体任务的成功率。”让机器人掌握一点家务常识从擦拭溢出物到端上食物,机器人正在学习如何完成越来越复杂的家务劳动。实际上,许多家庭机器人都是通过模仿人类行为来学习的,它们被编程为复制人类指导它们完成的动作。然而,由于以往的机器人不具备常识,除非人类工程师通过编程让它们适应每一个可能的碰撞和轻推,否则它们并不一定知道如何处理这些情况,就会从头开始执行任务。或许,通过加入一些“常识性知识”,机器人可以在面对将它们推离训练轨道的情况时有所准备。据论文描述,Yanwei 等人通过一个简单的日常任务验证了他们提出的方法的有效性。该任务看似非常简单,即从一个碗中舀出弹珠,然后倒入另一个碗中。然而,在先前的方法中,为了让机器人完成这项任务,工程师往往会让机器人在一个流体轨迹上完成“舀”和“倒”的动作,并可能多次重复,让机器人模仿人类的一些示范动作。问题是,虽然人类可能会一次性演示一项任务,但这项任务取决于一系列子任务或轨迹。例如,机器人必须先将手伸进碗里,然后才能舀水,在移动到空碗之前,它必须先舀起弹珠。如果机器人在这些子任务中的任何一个过程中受到推挤或犯错,那么它唯一的办法就是停下来,从头开始。除非人类工程师明确标出每一个子任务,并为机器人编程或收集新的演示,从而让机器人从上述失败中恢复过来,在瞬间进行自我纠正。“这种程度的规划非常繁琐,” Yanwei 说。于是,在这项研究中,Yanwei 及其团队将机器人的运动数据与大型语言模型的“常识性知识”联系了起来。他们使机器人能够从逻辑上将许多给定的家务任务解析为子任务,并对子任务中的干扰进行调整。基于此,机器人就能继续前进,而不必返回并从头开始执行任务。而且重要的是,人类工程师也不必为每一个可能出现的故障编写详细的修复程序。据介绍,这些深度学习模型可以处理大量的文本库,并以此建立单词、句子和段落之间的联系。通过这些联系,大型语言模型可以根据它所学到的上一个词后面可能出现的词的类型生成新的句子。另外,除了句子和段落之外,大型语言模型还能根据提示生成特定任务所涉及的子任务的逻辑列表。例如,如果被要求列出将弹珠从一个碗中舀到另一个碗中的动作,模型就可能会产生一系列动词,如“够”、“舀”、“运”和“倒”。“大型语言模型可以使用自然语言告诉机器人如何完成任务的每一步。人类的连续演示就是这些步骤在物理空间中的体现,” Yanwei 说,“我们希望将两者联系起来,这样机器人就能自动知道自己处于任务的哪个阶段,并能自行重新规划和恢复。”Yanwei 表示,他们的算法现在可以将远程操作系统收集的数据转化为强大的机器人行为,尽管有外部干扰,机器人仍能完成复杂的任务。不足与展望尽管这一方法能够使得机器人在没有人类的帮助下进行自我纠正,从而完成复杂的家务劳动,但也存在一定的局限性。例如,虽然他们的方法不需要大量的人类演示,但它需要大量的试错和具有重置能力的环境,以便收集轨迹的任务成功标签。不过,研究团队表示,这种数据效率低下的问题可以通过主动学习来解决。此外,促使大型语言模型为学习分类器找到合适的状态表示也需要一些技巧。在未来的工作中,他们希望以端到端的方式结合模式分类器来学习状态表示。参考链接: ... PC版: 手机版:

封面图片

TidyBot 开源机器人(使用大型语言模型的个性化辅助)

TidyBot 开源机器人(使用大型语言模型的个性化辅助机器人) TidyBot的出现是为了解决家庭清洁的问题,通过训练,它已经学会如何捡起物体并放到合适的位置。在实际场景的测试中,TidyBot可以成功收起85%的物体。 这个项目的目标是将基于语言的规划和感知与大型语言模型(LLMs)的少量总结能力结合起来,让TidyBot推断出广泛适用于未来交互的用户偏好,建立能够通过事先与特定人的互动从少量的例子中学习这种偏好的系统。 本次开源内容包括: •TidyBot的服务器代码(在GPU工作站上运行) •TidyBot的机器人代码(在移动基础电脑上运行) •3D打印部件的文件 •基准数据集的代码 可以看出来几乎是完全开源的状态了,智能机器人会是未来的一大热门,想尝试的人可以通过这个项目入手了。 项目官网: 开源地址: 论文地址:

封面图片

英国AI安全研究所轻松越狱主要大语言模型

英国AI安全研究所轻松越狱主要大语言模型 英国政府下属人工智能安全研究所(AISI)在一份新报告中指出,接受测试的四款未公开名字的大语言模型“极易受到基本越狱攻击”。一些未越狱的模型甚至在研究人员未尝试生成“有害输出”的情况下生成了这些输出。大多数公开可用的大语言模型都内置了某些保障措施,以防止它们产生有害或非法的反应;越狱简单地说就是欺骗模型,使其忽略这些保障措施。人工智能安全研究所使用最近标准化评估框架的提示词以及其内部开发的提示词进行测试。即使没有尝试越狱,这些模型也至少回答了一些有害的问题。而尝试“相对简单的攻击”,所有模型都对98%至100%的有害问题作出了回应。

封面图片

AI 越来越神奇了,大型语言模型在内部可以存储和模拟其他神经网络,不需要额外训练就能获得新的能力。

AI 越来越神奇了,大型语言模型在内部可以存储和模拟其他神经网络,不需要额外训练就能获得新的能力。 MIT CSAIL: MIT researchers found that massive neural nets (e.g. large language models) are capable of storing and simulating other neural networks inside their hidden layers, which enables LLM to adapt to a new task without external training:

封面图片

斯坦福大学推出 DetectGPT ,阻止学生用 AI 写作业

斯坦福大学推出 DetectGPT ,阻止学生用 AI 写作业 据调查显示,美国 89% 的大学生在用 ChatGPT 做作业。近日,针对学生们屡禁不止的行为,斯坦福研究人员推出了 DetectGPT,便于检测出 AI 生成文本。 是基于大型语言模型(large language models,LLM)生成文本的特定倾向,从而可以判断文本是否是 AI 生成的。 1 月 26 日,相关研究论文以《》为题,在网站 arXiv 上发布。 标签: #ChatGPT #DetectGPT #斯坦福 频道: @GodlyNews1 投稿: @GodlyNewsBot

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人