MIT的软体机器人系统专为包装杂货而设计 可识别葡萄等脆弱物品

MIT的软体机器人系统专为包装杂货而设计 可识别葡萄等脆弱物品 为了测试该系统,研究人员在杂货传送带上放置了 10 件以往机器人不怎么擅长的物品。这些产品既有葡萄、面包、羽衣甘蓝、松饼和饼干等精致物品,也有汤罐、餐盒和冰淇淋盒等坚固得多的物品。视觉系统首先检测物品,然后确定它们在传送带上的尺寸和方向。当抓取装置接触到葡萄时,手指上的压力传感器会判断出葡萄很脆弱,因此不应该放在袋子的底部毫无疑问,我们中的许多人都有过这样的惨痛教训。接着,它注意到汤罐是一种更坚硬的结构,于是把它塞进了袋子的底部。这项研究的主要作者之一张安南说:"这是机器人在现实世界中包装杂货和其他物品的重要第一步。虽然我们还没有做好商业部署的准备,但我们的研究证明了在软机器人系统中集成多种传感模式的力量。"研究小组指出,该系统仍有很大的改进空间,包括对抓取器和成像系统进行升级,以更好地确定如何打包以及打包的顺序。随着该系统变得越来越强大,它也可能会走出杂货店,进入回收厂等更多的工业空间。 ... PC版: 手机版:

相关推荐

封面图片

AI 和机器人帮助设计最佳电池

AI 和机器人帮助设计最佳电池 美国卡内基·梅隆大学研究人员温卡特·韦斯万纳森、杰·怀塔克利及他们的同事,设计了一个名为“Clio”的定制自动化机器人平台,并与一个名为“蜻蜓”(Dragonfly)的基于贝叶斯优化的AI相结合。利用这些工具,他们证明了该系统能在两个工作日里的42次实验中,自主筛选并确定出6种高导电非水锂离子电池的电解质配方。 研究人员指出,他们的方法发现电解质的速度是随机筛选速度的6倍。研究团队在商用锂离子软包电池中测试了该电解质溶液,并以传统的电解质组分作为基线实验,演示了其快速充电的性能。 研究团队总结道,他们的研究有助于高性能充电电池的研发,对于更大范围的能源应用和材料科学具有重要意义。前文: 来自:雷锋 频道:@kejiqu 群组:@kejiquchat 投稿:@kejiqubot

封面图片

MIT发明新型防伪ID标签 撕下即损毁 识别准确率超过99%

MIT发明新型防伪ID标签 撕下即损毁 识别准确率超过99%  新型 ID 标签的艺术效果图,该标签利用太赫兹波通过读取胶水中金属颗粒的指纹来验证物品的真伪。这种标签的原理与常用于跟踪库存和验证真伪的射频识别标签(RFID)相同。每个标签都有一个唯一的识别码,可以用扫描仪读取,以证明该物品是真品。但实际上,从技术上讲,它所做的只是验证标签的真伪,而不是标签上粘贴的任何东西。如果有人想绕过这个系统,他们所要做的其实就是剥下标签,然后贴在假货上。因此,在新的研究中,麻省理工学院的团队开发了一种新的标签,一旦标签被撕下,它的条形码就会被销毁。其中的诀窍在于,不是将 ID 嵌入标签本身,而是将其嵌入粘在物品上的胶水中。胶水中混入了微小的金属颗粒,粘在物体表面后,用高频太赫兹波扫描。金属微粒将这些波反弹回读取器,为这些金属微粒的排列方式拍摄快照。这种随机模式就像指纹一样,用于识别标签并存储在云端。如果有人试图将标签剥离并重新粘在其他东西上,就会破坏胶水中金属微粒的特定排列,从而在以后扫描时返回错误的 ID。这项研究的作者 Ruonan Han 说:"这些金属颗粒本质上就像是太赫兹波的镜子。如果我把一堆镜片铺在一个表面上,然后用光照射,根据这些镜片的方向、大小和位置,就会得到不同的反射图案。但如果你把芯片剥离并重新贴上,就会破坏这种图案。"太赫兹 ID 系统工作原理示意图。请注意真假物品胶水中颗粒的不同形态几乎不可能再现完全相同的形态 麻省理工学院 Jose-Luis Olivares研究小组称,这种 ID 标签体积小,只有 4 平方毫米( 0.006英寸),可以贴在各种物品上,而且价格便宜,可以大规模生产。经过训练的机器学习模型检测模式的准确率超过 99%。研究人员说,在目前的形式下,该系统可以在传感器距离标签最多 4 厘米(1.6 英寸)和 10 度角的范围内工作。这对于扫描仓库中的物品等用途是没有问题的,但对于识别通过收费站的汽车就不太合适了,研究人员计划今后努力解决这些缺陷。这项研究将在四月份举行的电气和电子工程师学会固态电路会议上发表。 ... PC版: 手机版:

封面图片

丰田新型软体仿人机器人Punyo可以用整个身体扛东西

丰田新型软体仿人机器人Punyo可以用整个身体扛东西 Punyo 的名字是"Punyo",它是一个躯干向上的人形研究平台。首先,它长着一张可爱、平易近人的脸,让人想起迪斯尼《超能陆战队》中的 Baymax“大白”。他似乎还穿着一件宽大舒适的毛衣,更增添了几分可爱的感觉。事实上,这件"毛衣"是有实际用途的。它采用高摩擦力材料制成,在 Punyo 坚硬的金属骨架上形成了一层柔软、顺滑的面料,面料上还装有触觉传感器,可以准确地感受到它所拥抱的物体,无论是人还是它所携带的物品。灵巧的双手可能会出现在路线图上,但现在 Punyo 展示的是一双......也许充气蹄子才是正确的词?但丰田称其为"爪子",甚至连抓握用的爪子都没有。它们的末端是可变形的充气垫,内部的点状图案由摄像头监控,这样当它们接触到什么东西时,图案就会变形,机器人就能看到并知道它接触到了什么东西。由于从肩部到腕部有 13 个充满空气的气囊阵列,因此手臂具有额外的柔软度,这些气囊可以根据机器人的需要单独调节压力,以获得最佳的硬度。通过远程操作,丰田研究集团的机器人专家一直在训练 Punyo 搬运一些不同的大型物品。有时,它需要身体前倾,将物品抱在胸前,然后身体后倾将其举起。其他时候,则是更有趣的搬运技术,比如把水壶举到肩上,然后从上面稳稳地拿住。此外,机器人的手臂还能真正堆起东西,看它搬东西的样子,处理大件物品的方式肯定比其他机器人更自然。今年 9 月,丰田公司展示了机器人学习方面的一项重大进展,该公司向机器人提供了如何完成几十种不同厨房任务的示例,包括在面包上涂抹东西、削土豆皮、擀披萨面团和用锅铲翻煎饼,然后,通过扩散策略学习系统,机器人在几个小时内模拟完成了这些任务,然后能够以灵活自主的方式重复它们所看到的内容。Punyo 采用的也是这种人工智能学习流程,但团队还能根据示例动作的紧密程度,或速度、效率或完成工作的关键性等因素的优先程度,调整变量。这肯定是一种与我们从其他类人猿身上看到的不同的方式,虽然这种拥抱式的举起并不适合每一种情况,但在某些情况下会很有意义。尤其是当这些机器进入我们的家庭,抱着我们的孩子时......这是个值得思考的问题。 ... PC版: 手机版:

封面图片

MIT研究人员利用人工智能将仓库改造成高效枢纽

MIT研究人员利用人工智能将仓库改造成高效枢纽 在一个巨大的机器人仓库里,数百个机器人在地面上来回穿梭,抓取物品并交付给人类工人进行包装和运输。这种仓库正日益成为从电子商务到汽车生产等许多行业供应链的一部分。然而,要让 800 个机器人高效地往返于目的地,同时又要防止它们相互碰撞,并非易事。这个问题非常复杂,即使是最好的路径搜索算法,也很难跟上电子商务或制造业的飞速发展。人工智能驱动的高效解决方案从某种意义上说,这些机器人就像试图在拥挤的市中心穿梭的汽车。因此,一群利用人工智能缓解交通拥堵的麻省理工学院研究人员运用了这一领域的理念来解决这一问题。他们建立了一个深度学习模型,对仓库的重要信息(包括机器人、计划路径、任务和障碍物)进行编码,并利用这些信息预测仓库的最佳疏导区域,以提高整体效率。他们的技术将仓库中的机器人分成若干组,因此这些较小的机器人组可以用协调机器人的传统算法更快地消除拥堵。最终,与强随机搜索法相比,他们的方法疏导机器人的速度快了近四倍。除了简化仓库作业,这种深度学习方法还可用于其他复杂的规划任务,如计算机芯片设计或大型建筑的管道布线。尖端的神经网络架构"我们设计了一种新的神经网络架构,它实际上适用于这些仓库这种规模和复杂程度的实时操作。它可以对数百个机器人的轨迹、出发地、目的地以及与其他机器人的关系进行编码,而且能以一种高效的方式在各组机器人之间重复使用计算,"土木与环境工程(CEE)专业吉尔伯特-W-温斯洛职业发展助理教授、信息与决策系统实验室(LIDS)和数据、系统与社会研究所(IDSS)成员凯茜-吴(Cathy Wu)说。该技术论文的资深作者 Wu 和第一作者、电子工程和计算机科学专业研究生 Zhongxia Yan 共同完成了这项研究。这项研究成果将在学习表征国际会议(International Conference on Learning Representations)上发表。机器人俄罗斯方块从鸟瞰图上看,机器人电子商务仓库的地面有点像快节奏的"俄罗斯方块"游戏。当客户下订单时,机器人会前往仓库的某一区域,抓起放置所需物品的货架,然后将其交给人类操作员,由其拣选和包装物品。数百个机器人同时进行这项工作,如果两个机器人在穿过巨大的仓库时发生路径冲突,就可能会撞车。传统的搜索算法可以避免潜在的碰撞,方法是保持一个机器人的运行轨迹,并为另一个机器人重新规划轨迹。但由于机器人数量众多,可能发生碰撞,问题很快就会呈指数级增长。"由于仓库是在线运行的,机器人大约每 100 毫秒重新扫描一次。也就是说,每秒钟,机器人要重新扫描 10 次。因此,这些操作必须非常快速,"Wu 说。由于在重新规划过程中时间非常关键,麻省理工学院的研究人员利用机器学习将重新规划的重点放在最有可能减少机器人总行驶时间的拥堵区域。Wu 和 Yan 建立的神经网络架构可同时考虑较小的机器人群组。例如,在一个拥有 800 个机器人的仓库中,网络可能会将仓库地面切割成更小的组,每组包含 40 个机器人。然后,如果使用基于搜索的求解器来协调该组机器人的轨迹,它就会预测出哪一组最有可能改进整体解决方案。整个算法是一个迭代过程,先用神经网络选出最有希望的机器人组,再用基于搜索的求解器解散机器人组,然后用神经网络选出下一个最有希望的机器人组,依此类推。简化复杂系统神经网络能有效地推理机器人群,因为它能捕捉到单个机器人之间存在的复杂关系。例如,即使一个机器人一开始离另一个机器人很远,它们在行进过程中的路径仍有可能交叉。该技术还能简化计算,只需对约束条件进行一次编码,而无需对每个子问题重复编码。例如,在一个拥有 800 个机器人的仓库中,要消除一组 40 个机器人的拥堵,需要将其他 760 个机器人作为约束条件。其他方法则需要在每次迭代中对每组所有 800 个机器人推理一次。相反,研究人员的方法只需要在每次迭代中对所有小组的 800 个机器人进行一次推理。她补充说:"仓库是一个大的环境,因此这些机器人群组中的很多都会在更大的问题上有一些共同点。我们设计的架构就是为了利用这些共同的信息。"研究人员在几个模拟环境中测试了他们的技术,包括一些像仓库一样的环境,一些带有随机障碍物的环境,甚至还有模拟建筑物内部的迷宫设置。通过识别出更有效的疏导群组,他们基于学习的方法疏导仓库的速度比强大的、非基于学习的方法快四倍。即使考虑到运行神经网络的额外计算开销,他们的方法解决问题的速度仍然快 3.5 倍。未来方向与同行认可未来,研究人员希望从他们的神经模型中获得简单、基于规则的见解,因为神经网络的决策可能不透明,难以解读。更简单、基于规则的方法也更容易在实际机器人仓库环境中实施和维护。"这种方法基于一种新颖的架构,在这种架构中,卷积和注意力机制能够有效地相互作用。令人印象深刻的是,它能够考虑到所构建路径的时空成分,而无需针对具体问题进行特征工程。结果非常出色。"康奈尔理工学院安德鲁-H.和安-R.-蒂施教授 Andrea Lodi 说:"我们不仅能在求解质量和速度方面改进最先进的大型邻域搜索方法,而且该模型还能很好地推广到未见过的案例中。"编译来源:ScitechDaily ... PC版: 手机版:

封面图片

MIT博士让机器人自学“常识”:大模型加持 可自主完成复杂家务劳动

MIT博士让机器人自学“常识”:大模型加持 可自主完成复杂家务劳动 相关研究论文以“Grounding Language Plans in Demonstrations Through Counterfactual Perturbations”为题,以会议论文的形式已发表在人工智能(AI)顶会 ICLR 2024 上。麻省理工学院(MIT)电气工程和计算机科学系博士 Yanwei Wang 为该研究论文的通讯作者。他表示,模仿学习是实现家用机器人的主流方法。但是,如果机器人盲目地模仿人类的运动轨迹,微小的错误就会不断累积,最终导致执行过程中的其他错误。“有了我们的方法,机器人就能自我纠正执行错误,提高整体任务的成功率。”让机器人掌握一点家务常识从擦拭溢出物到端上食物,机器人正在学习如何完成越来越复杂的家务劳动。实际上,许多家庭机器人都是通过模仿人类行为来学习的,它们被编程为复制人类指导它们完成的动作。然而,由于以往的机器人不具备常识,除非人类工程师通过编程让它们适应每一个可能的碰撞和轻推,否则它们并不一定知道如何处理这些情况,就会从头开始执行任务。或许,通过加入一些“常识性知识”,机器人可以在面对将它们推离训练轨道的情况时有所准备。据论文描述,Yanwei 等人通过一个简单的日常任务验证了他们提出的方法的有效性。该任务看似非常简单,即从一个碗中舀出弹珠,然后倒入另一个碗中。然而,在先前的方法中,为了让机器人完成这项任务,工程师往往会让机器人在一个流体轨迹上完成“舀”和“倒”的动作,并可能多次重复,让机器人模仿人类的一些示范动作。问题是,虽然人类可能会一次性演示一项任务,但这项任务取决于一系列子任务或轨迹。例如,机器人必须先将手伸进碗里,然后才能舀水,在移动到空碗之前,它必须先舀起弹珠。如果机器人在这些子任务中的任何一个过程中受到推挤或犯错,那么它唯一的办法就是停下来,从头开始。除非人类工程师明确标出每一个子任务,并为机器人编程或收集新的演示,从而让机器人从上述失败中恢复过来,在瞬间进行自我纠正。“这种程度的规划非常繁琐,” Yanwei 说。于是,在这项研究中,Yanwei 及其团队将机器人的运动数据与大型语言模型的“常识性知识”联系了起来。他们使机器人能够从逻辑上将许多给定的家务任务解析为子任务,并对子任务中的干扰进行调整。基于此,机器人就能继续前进,而不必返回并从头开始执行任务。而且重要的是,人类工程师也不必为每一个可能出现的故障编写详细的修复程序。据介绍,这些深度学习模型可以处理大量的文本库,并以此建立单词、句子和段落之间的联系。通过这些联系,大型语言模型可以根据它所学到的上一个词后面可能出现的词的类型生成新的句子。另外,除了句子和段落之外,大型语言模型还能根据提示生成特定任务所涉及的子任务的逻辑列表。例如,如果被要求列出将弹珠从一个碗中舀到另一个碗中的动作,模型就可能会产生一系列动词,如“够”、“舀”、“运”和“倒”。“大型语言模型可以使用自然语言告诉机器人如何完成任务的每一步。人类的连续演示就是这些步骤在物理空间中的体现,” Yanwei 说,“我们希望将两者联系起来,这样机器人就能自动知道自己处于任务的哪个阶段,并能自行重新规划和恢复。”Yanwei 表示,他们的算法现在可以将远程操作系统收集的数据转化为强大的机器人行为,尽管有外部干扰,机器人仍能完成复杂的任务。不足与展望尽管这一方法能够使得机器人在没有人类的帮助下进行自我纠正,从而完成复杂的家务劳动,但也存在一定的局限性。例如,虽然他们的方法不需要大量的人类演示,但它需要大量的试错和具有重置能力的环境,以便收集轨迹的任务成功标签。不过,研究团队表示,这种数据效率低下的问题可以通过主动学习来解决。此外,促使大型语言模型为学习分类器找到合适的状态表示也需要一些技巧。在未来的工作中,他们希望以端到端的方式结合模式分类器来学习状态表示。参考链接: ... PC版: 手机版:

封面图片

斯坦福团队新作:喊话就能指导机器人 任务成功率暴增

斯坦福团队新作:喊话就能指导机器人 任务成功率暴增 比如在这个场景中,机器人没能完成系统设定的“把海绵放入袋子”的任务。这时研究者直接朝它喊话,“用海绵把袋子撑得再开一些”,之后就一下子成功了。而且,这些纠正的指令还会被系统记录下来,成为训练数据,用于进一步提高机器人的后续表现。有网友看了说,既然已经能朝着机器人喊话了,那汽车是不是也快点安排上,还在线点名特斯拉和其自动驾驶软件总监Ashok Elluswamy。成果发布后,前Google机器人高级研究员Eric Jang,前DeepMind研究员、斯坦福客座教授Karol Hausman等一众大佬也纷纷表示了肯定和赞许。那么,用喊话调整的机器人,都能实现什么样的动作呢?喊话就能发号施令利用YAY技术调教后,机器人以更高的成功率挑战了物品装袋、水果混合和洗盘子这三项复杂任务。这三种任务的特点是都需要两只手分别完成不同的动作,其中一只手要稳定地拿住容器并根据需要调整姿态,另一只手则需要准确定位目标位置并完成指令,而且过程中还涉及海绵这种软性物体,拿捏的力度也是一门学问。以打包装袋这个任务为例,机器人在全自主执行的过程中会遇到各种各样的困难,但通过喊话就能见招拆招。只见机器人在将装袋的过程中不小心把海绵掉落了下来,然后便无法再次捡起。这时,开发者直接朝它喊话,口令就是简单的“往我这边挪一挪,然后往左”。当按照指令做出动作后,第一次还是没成功,但机器人记住了“往左”这个指令,再次左移之后便成功把海绵捡起来了。但紧接着就出现了新的困难袋子的口被卡住了。这时只要告诉它再把袋子打开一点点,机器人就“心领神会”,调整出了一系列后续动作,并最终成功完成任务。而且不只是能纠正错误,任务的细节也能通过喊话实时调整,比如在装糖的任务中,开发者觉得机器人拿的糖有点多了,只要喊出“少一点”,机器人就会将一部分糖果倒回盒子。进一步地,人类发出的这些指令还会被系统记录并用作微调,以提高机器人的后续表现。比如在刷盘子这项任务中,经过微调之后的机器人清洁力度更强,范围也变大了。统计数据表明,机器人在经历这种微调之后,平均任务成功率提高了20%,如果继续加入喊话指令还能继续提高。而且这样的指令-微调过程可以迭代进行,每迭代一次机器人的表现都能有所提升。那么,YAY具体是如何实现的呢?人类教诲“铭记在心”架构上,整个YAY系统主要由高级策略和低级策略这两个部分组成。其中高级策略负责生成指导低级策略的语言指令,低级策略则用于执行具体动作。具体来说,高级策略将摄像头捕捉到的视觉信息编码,与相关知识结合,然后由Transformer生成包含当前动作描述、未来动作预测等内容的指令。而低级策略接收到语言指令后,会解析这些指令中的关键词,并映射到机器人关节的目标位置或运动轨迹。同时,YAY系统引入了实时的语言纠正机制,人类的口头命令优先级最高经识别后,直接传递给低级策略用于执行。且在这个过程中命令会被系统记录并用于微调高级策略通过学习人类提供的纠正性反馈,逐渐减少对即时口头纠正的依赖,从而提高长期任务的自主成功率。在完成基础训练并已经在真实环境中部署后,系统仍然可以继续收集指令信息,不断地从反馈中学习并进行自我改进。作者简介本项目的第一作者是斯坦福大学的学生研究员Lucy X. Shi,2019年毕业于人大附中后进入南加州大学就读计算机科学专业。其间,Lucy曾到英伟达实习研究多模态大模型,并曾与知名AI学者Jim Fan博士合作。她的论文曾连续两年被机器人顶会CoRL收录,还入选过NeurIPS,本人还被DeepMind邀请发表过演讲。Lucy的导师Chelsea Finn是斯坦福计算机科学和电气工程系助理教授,Google学术论文引用数超4.7万,此前还在Google Brain工作过一段时间。包括本项目在内,在ALOHA团队发表的一系列论文当中,Finn总是作为通讯作者出现。此外,ALOHA团队的Tony Z. Zhao、Sergey Levine等研究人员,也是本文的共同作者。 ... PC版: 手机版:

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人