Emo机器人在你微笑之前就能感知你的微笑 并做出回应

Emo机器人在你微笑之前就能感知你的微笑 并做出回应 哥伦比亚大学哥伦比亚工程学院创意机器实验室的研究人员通过教他们的蓝硅拟人机器人头"Emo"预测人的微笑并做出回应,解决了这一难题。设计一个能对非语言提示做出反应的机器人涉及两个挑战。首先是创造一个表情丰富但功能多样的面部,这涉及到复杂的硬件和执行机制。其次是教会机器人及时做出何种表情,以便显得自然和真实。Emo 可能"只是一个脑袋",但它由 26 个执行器组成,可以做出各种细微的面部表情。两个瞳孔中的高清摄像头使 Emo 能够进行非语言交流所需的眼神交流。为了训练 Emo 如何做出面部表情,研究人员把它放在摄像头前,让它做一些随机动作相当于我们在照镜子时练习不同的表情。几个小时后,Emo就学会了哪些动作指令会产生相应的面部表情。随后,Emo 观看了人类面部表情的视频,逐帧进行分析。再经过几个小时的训练,Emo 就能通过观察微小的变化来预测人的面部表情了。Emo 在人类微笑发生前约 840 毫秒预测到了人类的微笑,并同时做出了自己的回应(尽管这样做看起来相当吓人)。人类与机器人的面部共同表情该研究的第一作者胡宇航说:"我认为准确预测人类面部表情是 HRI(人机交互)领域的一场革命。传统上,机器人在设计时并没有考虑到人类在交互过程中的表情。现在,机器人可以整合人类的面部表情作为反馈,当机器人与人实时做出共同表情时,不仅能提高交互质量,还有助于建立人类与机器人之间的信任,未来,在与机器人互动时,机器人会像真人一样观察并解读你的面部表情。"目前,研究人员正在努力将 LLM 集成到 Emo 中,使其能够进行语言交流,他们非常清楚开发这种先进机器人所涉及的伦理问题。"尽管这种能力预示着从家庭助手到教育辅助工具等大量积极的应用,但开发者和用户仍有责任谨慎行事,并考虑道德因素,"该研究的通讯作者、创意机器实验室主任霍德-利普森(Hod Lipson)说。"但这也非常令人兴奋通过开发能够准确解读和模仿人类表情的机器人,我们正一步步接近这样一个未来:机器人可以无缝融入我们的日常生活,为我们提供陪伴、帮助,甚至是共鸣。想象一下,在这个世界上,与机器人互动就像与朋友交谈一样自然、舒适。"这项研究发表在《科学机器人学》(Science Robotics)上。 ... PC版: 手机版:

相关推荐

封面图片

这张由由活体皮肤制成的微笑机器人脸看着令人有些不安

这张由由活体皮肤制成的微笑机器人脸看着令人有些不安 但是,在某些情况下,亿万年进化所产生的巧妙机械很可能比人造皮肤(也在不断发展中)或更简单的表面更好。然而,这种活体组织表面将如何附着在机器人肢体或"面部"的机械基础上?在人类和其他动物身上,有一个韧带网络将皮肤固定在下层肌肉和组织上。我发现这种方法非常有效。东京大学和哈佛大学的研究人员想测试一下,他们是否能创造出这样一种版本,让活体皮肤既能紧贴人造基底,又能在不同方向上进行操作,而不会出现撕裂或意外变形。他们的"真皮等效"效果如何?一起来评判吧:当然,现在看来这很可怕,但它并不是为了逼真或美观,只是为了说明一种将活体组织附着到机器人底盘上的潜在方法。是的,这正是终结者 T-100 模型所具有的功能,但我们还是不要想太多了。除了潜入过去摧毁人类的未来之外,披着皮肤的机器人还能做各种有用的事情。正如他们所说的那样,"培养皮肤"可以自我愈合,携带与我们的皮肤一样的生物传感器,提供灵敏的触感,还可以在医疗或人际交往方面发挥作用。但前提是,它能在皮肤上保持活力,并能像我们日常使用皮肤时那样随意移动。这就是本文想要展示的部分内容:一种可用于脸部或作为脸部的附着和操纵工作方法。 ... PC版: 手机版:

封面图片

只用13天 OpenAI做出了能听、能说、能自主决策的机器人大模型

只用13天 OpenAI做出了能听、能说、能自主决策的机器人大模型 Figure,OpenAI 投资的机器人公司,上传了这段视频。在视频中,Figure 的人形机器人,可以完全与人类流畅对话,理解人类的意图,同时还能理解人的自然语言指令进行抓取和放置,并解释自己为什么这么做。而其背后,就是 OpenAI 为其配置的智能大脑。在过去一年的具身智能进展中,或许你曾经看过类似的机器人自主决策、拿取物品的展示,但在这段视频中,Figure 人形机器人的对话流畅度、展现出的智能感,接近人类操作速度的动作流畅性,绝对都是第一流的。Figure 还特意强调,整段视频没有任何加速,也没有任何剪辑,是一镜到底拍摄的。同时,机器人是在完全自主的情况下进行的行为,没有任何远程操纵似乎在暗暗讽刺前段时间爆火的展现了酷炫机械能力,但是没有太多智能程度的斯坦福炒菜机器人。比起机器人的智能表现,更可怖的是,这只是 OpenAI 小试牛刀的结果从 OpenAI 宣布与 Figure 共同合作推进人形机器人领域的前沿,到这个视频的发布,只有短短的十三天。此次 Figure 人形机器人背后的智能,来自端到端的大语言-视觉模型,这是具身智能领域目前非常前沿的领域。去年极客公园报道过Google在类似领域的进展。Google做出的端到端机器人控制模型,被一些行业内的人士,誉为机器人大模型的 GPT-3 时刻。而当时,Google的机器人模型,还只能根据对话来做一些抓取,并不能与人类对话,也不能向人类解释自己为什么会这么做。而Google自身,从 Everyday Robotics 开始,已经有了五年以上的机器人研究经验。而 Figure 本身,成立于 2022 年。从OpenAI 宣布介入与之合作,到今天它们共同推出一个能够自主对话和决策的机器人,只有 13 天。机器人智能的发展,显然正在加速。01. 端到端大模型驱动,机器人的速度已经接近人类速度Figure 的创始人 Brett Adcock 和 AI 团队的负责人 Corey Lynch 在 X 上解释了此次视频中机器人互动背后的原理。此次的突破,由 OpenAI 与 Figure 共同做出。OpenAI 提供负责提供视觉推理和语言理解,而 Figure 的神经网络提供快速、低水平、灵巧的机器人动作。机器人所做出的所有行为都是出于已经学习过,内化了的能力,而不是来自远程操作。研究人员将机器人摄像头中的图像输入,和机载麦克风捕获的语音中的文本转录到由 OpenAI 训练的,可以理解图像和文本的多模态模型(VLM)中,由该模型处理对话的整个历史记录,得出语言响应,然后通过文本到语音的方式将其回复给人类。同样的模型,也负责决定在机器人上运行哪些学习的闭环行为来完成给定的命令,将特定的神经网络权重加载到 GPU 上并执行策略。这也是为什么这个机器人,属于“端到端”的机器人控制。从语言输入开始,模型接管了一切处理,直接输出语言和行为结果,而不是中间输出一些结果,再加载其他程序处理这些结果。Figure 的机载摄像头以 10hz 的频率拍摄图像,然后神经网络以 200hz 输出 24 个自由度动作。Figure 的创始人提到,这代表机器人的速度已经有显著提高,开始接近人类的速度。Corey Lynch 的 XOpenAI 的模型的多模态能力,是机器人可以与世界交互的关键,我们能够从视频中展示中看到许多类似的瞬间,比如:描述一下它的周围环境。做出决定时使用常识推理。例如,“桌子上的盘子和杯子等餐具接下来很可能会进入晾衣架”。将“我饿了”等模棱两可的高级请求转化为一些适合上下文的行为,例如“递给对方一个苹果”。用简单的英语描述*为什么*它会执行特定的操作。例如,“这是我可以从桌子上为您提供的唯一可食用的物品”。而模型能力的强大,使其还能够拥有短期记忆,比如视频中展示的“你能把它们放在那里吗?”“它们”指的是什么?“那里”又在哪里?正确回答需要反思记忆的能力。而具体的双手动作,可以分成两步来理解:首先,互联网预训练模型对图像和文本进行常识推理,以得出高级计划。如视频中展示的:Figure 的人形机器人快速形成了两个计划:1)将杯子放在碗碟架上,2)将盘子放在碗碟架上。其次,大模型以 200hz 的频率生成的 24-DOF 动作(手腕姿势和手指关节角度),充当高速“设定点(setpoint)”,供更高速率的全身控制器跟踪。全身控制器确保安全、稳定的动力,如保持平衡。所有行为均由神经网络视觉运动 Transformer 策略驱动,将像素直接映射到动作。02.从 ChatGPT 到 Sora,再到机器人,OpenAI 想包揽“智能”这件事2021 年夏天,OpenAI 悄悄关闭了其机器人团队,当时,OpenAI 曾宣布无限期终止对机器人领域的探索,原因是缺乏训练机器人使用人工智能移动和推理所需的数据,导致研发受到阻碍。但显然,OpenAI 并没有放下对这个领域的关注。2023 年 3 月,正在一年前,极客公园报道了 OpenAI 投资了来自挪威的机器人制造商 1X Technologies。其副总裁正是我在文初提到的,认为具身智能将会突然到来的 Eric Jang。而无独有偶,1X Technologies 的技术方向,也是端到端的神经网络对于机器人的控制。而今年 3 月初,OpenAI 和其他投资人一起,参与了 Figure 的 B 轮融资,使其成立两年,就达到了 26 亿美金估值。也正是在这一轮融资之后,OpenAI 宣布了与 Figure 的合作。Figure 的创始人 Brett Adcock,是个“擅长组局”的连续创业者,整个职业生涯中创立过至少 7 家公司,其中一家以 27 亿美元的估值上市,一家被 1.1 亿美元的价格收购。创建公司后,他招募到了研究科学家 Jerry Pratt 担任首席技术官,前波士顿动力/苹果工程师 Michael Rose 担任机器人控制主管。此次进行分享的 AI 团队负责人 Corey Lynch,则原本是 Google Deepmind 的 AI 研究员。Figure 宣布自己在电机、固件、热量、电子产品、中间件操作系统、电池系统、执行器传感器、机械与结构方面,都招募了硬核的设计人才。公司的确进展很快。在与 OpenAI 合作之前,已经做出了不少成绩。2024 年 1 月,Figure 01(Figure 的第一款人形机器人) 学会了做咖啡,公司称,这背后引入了端到端神经网络,机器人学会自己纠正错误,训练时长为 10 小时。Figure 01 引入 AI 学会做咖啡2 月,公司对外展示 Figure 01 的最新进展,在视频里,这个机器人已经学会搬箱子,并运送到传送带上,但速度只有人类的 16.7%。甚至在商业化上,也已经迈出了第一步:Figure 宣布与宝马制造公司签署商业协议,将 AI 和机器人技术整合到汽车生产中,部署在宝马位于南卡罗来纳州斯巴达堡的制造工厂。而在今天的视频展示推文中,Figure 宣布其目标是训练一个世界模型,最终能够卖出十亿个级别的模型驱动的人形机器人。不过,尽管OpenAI与 Figure的合作进展顺畅,但看起来 OpenAI 并未把宝压在一家机器人公司。北京时间 3 月 13 日,来自Google研究团队、加州大学伯克利分校、斯坦福大学教授等一群研究者新成立的一家机器人 AI 公司 Physical Intelligence,被彭博社爆料也拿到了 OpenAI 的融资。毫无意外,该公司,也是研究未来能够成为通用机器人系统的人工智能。多头下注机器人领域,13 天合作做出领先的机器人大模型,OpenAI 在机器人领域意图为何,引人关注。智能人形机器人,未来不止看马斯克的了。 ... PC版: 手机版:

封面图片

科学家发现面部电刺激会影响情绪感知 微笑是看到幸福的秘诀

科学家发现面部电刺激会影响情绪感知 微笑是看到幸福的秘诀 一股无痛的电流瞬间操纵着肌肉,让人情不自禁地露出短暂的微笑。这是首次证明面部电刺激会影响情绪感知。科布博士希望这项研究能探索出治疗抑郁症或影响表达的疾病(如帕金森症和自闭症)的潜在方法。刺激装置特写。资料来源:埃塞克斯大学他说:"有控制地、短暂而微弱地激活面部肌肉,就能让原本中性甚至略带悲伤的面部产生快乐的错觉,这一发现具有突破性意义。它与关于面部反馈在情绪感知中的作用的理论辩论有关,并具有未来临床应用的潜力。"科布医生使用的是法国医生 Duchenne de Boulogne 在 19 世纪首次开发的一种技术的现代化版本。这段视频介绍了这一突破性技术。资料来源:埃塞克斯大学达尔文在《人和动物的情感表达》一书中发表了杜肯的研究成果,这是他关于进化论的第三部重要著作。然而,为了确保参与者的安全和更好地控制微笑,新实验的电压被调低了。实验方法和结果通过使用计算机,研究小组能够以毫秒级的精度控制微笑的开始。共有47人参加了埃塞克斯大学的这项研究,研究结果发表在《社会认知与情感神经科学》(Social Cognitive and Affective Neuroscience)杂志上。他们看到了数字头像,并被要求评估它们看起来是快乐还是悲伤。在一半的试验中,微笑肌肉在表情开始时被激活。结果表明,500 毫秒的微弱微笑足以诱发幸福感。科布博士说,这些结果有助于我们了解面部反馈,他希望能扩大这项研究。他说:"我们目前正在开展更多研究,以进一步探索健康参与者的这一现象。不过,我们希望将来能将这种技术应用于探索面部情绪识别,用于帕金森病等疾病患者,因为众所周知,帕金森病患者的自发面部模仿能力下降,面部情绪识别能力受损。此外,我们还发布了相关指南,以便其他研究人员能够安全地开始使用面部肌肉电刺激技术。"编译自:ScitechDaily ... PC版: 手机版:

封面图片

机器人AnyMate 功能:图片转表情

机器人AnyMate 机器人功能:图片转表情 机器人简介:一款可以将图片中的人物生成动态表情包的TG机器人。 将含有正脸的图片发给机器人,可以获取使用该脸的动态表情包。 机器人ID:@anymate_bot

封面图片

机器人Emoji 功能:表情下载、格式转换

机器人Emoji 机器人功能:表情下载、格式转换 机器人简介:一款多功能机器人,发送表情给机器人,机器人会回复可下载的png图片。可以下载表情在其它平台使用,或者自己收藏做成自己的表情包。 还有图片、音频、视频的格式转换,还可调整图片大小。 机器人ID:@EmojiTgsBot 频道 群聊 投稿

封面图片

机器人Favorite Stickers Create Bot

机器人Favorite Stickers Create Bot 机器人功能:表情包和贴纸制作 机器人简介:一款制作telegram表情包和贴纸的机器人。可以将自己喜欢的一些贴纸发给机器人做成表情包附上自己频道名来宣传自己频道。 也可以上传视频或Gif文件直接做成TG贴纸使用,无需进行格式转换。 机器人ID:@fStikBot 频道 群聊 投稿 商务

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人