谷歌PaLM-SayCan模型可让机器人更好地理解自然语言并执行复杂任务
谷歌PaLM-SayCan模型可让机器人更好地理解自然语言并执行复杂任务长期使用Alexa、Siri、GoogleAssistant等数字助理的朋友,或许已留意到这项技术正在变得愈加智能。与此同时,近年来的机器人技术也在突飞猛进。以谷歌为例,该公司有在演示一款乒乓球机器人,旨在训练其应对快速、自适应、且精确的任务挑战。Google研究员接触科学家兼机器人技术负责人VincentVanhoucke表示:“在一鸣惊人之前,你必须勤学苦练”。(图viaHajeKamps)在速度和精度之外,Google还希望通过实验,攻克人类语言和机器人技术的交叉点。截至目前,这家科技巨头已在自然语言水平上取得了让人印象深刻的飞跃。举个例子,你可能会对一个人说——“有空帮我从柜台拿一杯饮料吗?”尽管对于人类来说,这句话的语境相当简洁。但是对于一台机器人来说,其中包含的信息量很可能将其绊倒。因为‘有空’这词语可能不包含任何意义,也可能是趁着机器人正在干另一件时与之通过自然语言交互。如果机器人过度理解了字面含义,它可能会回答一句‘当然可以’——即便用户并未明确要求它这么做。若机器人更加钻牛角尖,它可能又会陷入该帮你拿哪一种饮料的纠结。好消息是,Google正在使用该公司的NLP系统拉解决一些问题。在Pathways语言模型(PaLM)的帮助下,机器人有望更准确地接收并理解人类的真实所想。下一阶段的挑战,则是审视机器人能够切实做到哪些事情。比如让你让机器人拾取冰箱顶部的一瓶清洁剂时,它是否会小心安全地摆放到儿童不易接触到的地方。不过在此之前,Google还是会着眼于更加普适性的任务。简单的有‘向前移动一米’,稍微高级点的可以是‘去厨房拿一罐可乐’。然后才是复杂多步任务的拆解执行,比如——‘啊哦,我不小心将可乐撒地板上了!能帮忙清理干净、并再给我拿一杯吗?’对此,Google选择的方案是利用语言“讲述”(Say)模型中所包含的知识,来帮助机器人确定并评估哪些高级指令“可否”(Can)派上用场。在融汇了PaLM语言模型之后,Google已将它重命名为PaLM-SayCan,且正在自家实验室使用来自EverydayRobots的一些机器人(上图展示其已学会何时去充电休息)。当然,在投入实际商用之前,这项技术显然还有相当多需要完善的地方,尤其是需要事先收集极其庞大的知识与技能数据集。PC版:https://www.cnbeta.com/articles/soft/1305589.htm手机版:https://m.cnbeta.com/view/1305589.htm