谷歌母公司Alphabet的机器人团队“Everyday Robots”将其研发的100多台落地,部署在其山景城的园区内,

谷歌母公司Alphabet的机器人团队“Everyday Robots”将其研发的100多台机器人落地,部署在其山景城的园区内,测试其自主执行擦桌子、推凳子、开门等日常任务能力,这一成果也首度公布于众。与市面上常见的机器人不同,这些机器人可以在非结构化环境中完成多项任务,并且能够自主学习。 #抽屉IT

相关推荐

封面图片

谷歌已经与 Alphabet 的子公司 Everyday Robots 合作,创造出能够应对复杂请求的机器人服务员。

谷歌已经与 Alphabet 的子公司 Everyday Robots 合作,创造出能够应对复杂请求的机器人服务员。 这些机器使用 PaLM-SayCan 方法,该方法将语言AI模型与机器人学习算法相结合。 用户给机器人一个查询,语言模型将其变成一连串要执行的步骤。该序列与机器人的技能和环境相关联。 通过将在维基百科、社交媒体和其他网站上训练的语言神经网络嵌入机器人,使这一连串的步骤成为可能。 到目前为止,这些机器人只做了几十个简单的动作。例如,当被要求帮助清理洒出来的水时,机器人认为拿起海绵是最明智的行动,并执行了这一做法。 机器人服务员还将为员工提供小吃和饮料。 如果您错过了《》

封面图片

上海交大团队研制“导盲六足机器人”:1秒之内可响应,已在实测

上海交大团队研制“导盲六足机器人”:1秒之内可响应,已在实测 这是一款来自上海交通大学机械与动力工程学院高峰教授团队研发的“六条腿”导盲机器人。在刚刚过去的由中国残联主办的“科技助残 共享美好生活”展会上,这款机器人吸引了众多人的目光。5月28日,高峰在上海交大对这款机器人进行了一次集中介绍。据高峰介绍,“导盲六足机器人”具有视觉环境感知功能,可自主导航至目的地、动态躲避障碍、识别红绿灯等。该款机器人如通过批量化生产、人工智能辅助可有效降低成本、提升智能,可解决导盲犬数量短缺的问题。不仅如此,通过后台建立完整的互联网服务体系,导盲机器人还可以实现居家陪护、应急处理,带领盲人抵达更多地方等功能。高峰在上海交大对“导盲六足机器人”进行介绍。 本文图片为 澎湃新闻记者 邹佳雯 图突破人机交互技术,让导盲机器人成为视障人士的“第二双眼睛”为什么会研究导盲机器人?高峰谈到,据世界卫生组织统计,我国视障人士已经突破1700万人,这意味着每100人中就有至少一位视障者。但是,和庞大的视障人士数量对比,全国现役导盲犬数量仅几百只。不仅如此,导盲犬的培育还需要极高的培训成本,以及极长的训练周期,并且许多场合能否允许工作中的导盲犬进入尚处于讨论当中,仅仅依靠导盲犬远远不能满足我国千万余名视障人士的需求。基于此,团队开始了导盲六足机器人的研发工作。高峰介绍,和盲人建立有效沟通,让导盲机器人在理解使用者意图的同时维持机器人自身动作协调,是导盲机器人的首要任务。团队在导盲机器人上集成了听觉、触觉和力觉三种交互方式,实现盲人与导盲六足机器人之间的人机智能感知与顺应性行为。机器人可根据盲人的语音指令,基于深度学习端到端语音识别模型理解语义信息,快速响应、准确识别,目前语音识别准确率为90%以上,响应速度在1秒之内。高峰团队研制的“导盲六足机器人”此外,机器人可通过语音下发指令,如启动、停止、设定目的地、加速、减速等,同时实时反馈行走和环境状况等信息,实现双向智能交互。盲杖可以实现盲人与导盲机器人之间的力觉交互,向盲人提供牵引力和转向力矩,引导盲人前进和转向。盲人也可以推拉盲杖来动态调整机器人的行走速度。目前机器人最大速度达3m/s,能够满足盲人慢走、快走、跑步等出行需求,且六足的独特构型优势确保机器人可以低噪声稳定行走。人机交互与机器人自律协同控制是机器人融合感知信息、任务需求、人机交互的指令,利用逻辑推理、自律决策,可实现智能导盲作业行为。基于导盲机器人的动力学模型,高峰团队构建了层级递进式外力估计、触地检测、坡度估计、运动状态估计模型算法,融合机器人关节、惯性导航、行为节律、历史状态等多源信息,进行多目标集成的状态观测和反馈优化的平衡控制,由此,能够实现导盲机器人在各类地形场景中自律协同控制效果。已进入实地测试阶段,将加快落地实用导盲机器人在复杂地形行走需要更高的自主规划能力,这类自主规划功能通常包含地面信息的获取和建模、定位导航、落脚点的选择、身体位姿规划以及连续运动的规划等。定位精准是导盲任务的核心要求之一,团队通过多传感器数据紧耦合方式,建立了雷达-惯性里程计系统,通过滑动窗口法耦合历史帧数据,大幅减少点云运动畸变,并设计了多维度的状态残差,显著提高了系统状态估计的精度和鲁棒性,实现了三维环境地图的精准建立与机器人自身的精准定位。而基于全局环境地图和实时感知的局部动态地图,科研团队采用模型预测和实时滚动优化方法实现机器人的路径规划和自主避障,敏捷自主躲避静态和动态障碍物,保障导盲任务的安全性。根据室内导航任务需求,团队制定了室内场景的多层导航策略,构建了层次拓扑地图实现室内全局路径规划;针对室外场景,基于环境地图结合GPS信息进行多传感器融合,大幅提高定位与导航精度。团队还利用深度相机,通过深度学习和数字图像处理技术实现对交通信号的辨别,保障使用者出行安全。针对台阶、楼梯等典型地形环境,团队采用多约束优化算法规划机器人稳定行走步态;通过采集机器人腿部足端力觉信息,使用机器学习方法来实时辨识足-地接触模型,可实现机器人对不同地形的自适应动态敏捷柔顺行走。高峰介绍,目前,团队研发制成的导盲机器人已进入实地测试阶段。在整个研究推进过程中,由视障人士参与线下展示与功能测试,未来团队也将根据视障人士的实时反馈,对机器人持续研发、调试。此外,导盲机器人的实际应用,不单单是机器人本身的应用,还需要后台大数据的支持,需要强大的运维团队的支持以及一系列推广普及的测试。据了解,高峰团队还与索辰科技密切合作,面向导盲机器人需求,开展了商业化推广。上海交通大学负责基础理论研究和关键技术攻关,索辰科技负责产品工程化以及产业化运维和推广,双方共同努力,并借助社会力量,加快导盲六足机器人的落地使用,为改善我国视障人士生活贡献一份力量。 ... PC版: 手机版:

封面图片

首个自主完成人类任务机器人出现:五指灵活速度超人 大模型加持虚拟空间训练

首个自主完成人类任务机器人出现:五指灵活速度超人 大模型加持虚拟空间训练 而特斯拉的擎天柱也屡屡传出好消息。没人怀疑,今年会是人形机器人爆发的一年。一家位于加拿大的机器人公司Sanctuary AI最近发布了一款全新的人形机器人Phoenix。官方号称它能以和人类一样的速率自主完成很多工作。世界上第一台能以人类速度自主完成任务的机器人Pheonix可以轻轻地抓取、移动并优雅地将每个对象放置在它的左右两侧。它可以自主地识别物体的颜色,将不同颜色的物体分开放置,整个过程非常丝滑,速度确实和人类差不多。时代周刊在将Phoenix评为了2023年的最佳发明,说明了主流的大众媒体对他们的认可。Phoenix由先进且独特的人工智能系统 Carbon 来控制,身高1米7,重155磅,拥有行业最领先的机器手,可与人类手的灵活性和精细操作相媲美。Carbon融合现代人工智能技术,将自然语言转化为现实世界的行动,具有可解释、可审查的推理能力,负责规划任务和运动计划,使得Phoenix能像人一样思考、行动,从而完成工作任务。它的工作负载可以达到25公斤,并且能以5公里每小时的速度进行移动。有网友做了一个统计所有机器人公司产品向人类“进化”的进度的表格,可以看出,头部几家公司已经能够完成自主的工作任务了。而要完成精细的工作任务,主要的难点就在于手部的灵活性和控制技术上。根据Sanctuary AI的演示,现在机器人已经可以自主完成很多简单的工作了。检查试管。将螺丝和螺母分类。将物品放入瓶子中。对物品进行扫码识别。还可以自主完成像人类一样的叠方块游戏。训练方式:从远程遥控数据中自主学习Sanctuary AI 使用远程操作对Pheonix 进行训练。工作人员通过VR系统,操纵机器人的四肢、手和手指完成各种任务。然后,将操作过程中的数据放在一个模拟的系统中,对机器人进行训练。而为了实现训练之后的动作,并且同时让机器人的动作能够达到迅速,有力,而且精准,他们选择了液压系统来完成对于机器人的操控。根据CTO Gildert的说法,只有液压系统能够让机器人“做一些非常灵巧的事情,比如穿针、扣纽扣之类的,你必须问自己,那只手还能举起一个 50 磅重的手提箱,并且以人类速度在键盘上打字。”在去年3月份,他们把机器人放到了温哥华的一个超市中,让它完成了110项与零售相关的任务。这包括挑选和包装商品、贴标签、贴标签、折叠和清理商店。公司核心创始人CEO:Geordie Rose他是一名科技行业的连续创业者。在2018年创立Sanctuary AI之前,他曾经创立了2家高科技公司:Kindred.ai:世界上第一家制造能在生产环境中使用的强化学习的机器人公司。D-Wave Systems Inc.:世界上第一家量子计算公司,向Google、美国宇航局、洛克希德·马丁公司、Gap Inc. 和几个美国政府机构出售量子计算机。他是不列颠哥伦比亚大学理论物理学博士。他还是一名搏击运动员,曾经是两届加拿大国家摔跤冠军,并且是 2010年NAGA大师白带巴西柔术世界锦标赛道道和无道类别的冠军。CTO:Suzanne Gildert她之前和CEO一起,在D-Wave和Kindred都担任重要职务。在加入Sanctuary之前,Suzanne是Kindred AI的联合创始人。她负责监督公司类人机器人的设计和工程,并负责开发认知架构,使机器人能够了解自己及其环境。在D-Wave期间,Suzanne开发了MAXCAT世界上第一个针对量子计算机的游戏,开发了世界上第一个在量子计算机上运行的监督分类器,并且是第一个使用量子计算机控制机器人运动的人。她毕业于伯明翰大学,研究方向是实验量子物理。他们两人同时也在网上定期发布与技术有关的播客,涉及内容从公司的治理到公司的具体技术细节,如果对人形机器人有兴趣的话千万不要错过他们的精彩内容。 ... PC版: 手机版:

封面图片

机器狗界变形金刚来了:“人”狗之间灵活切换

机器狗界变形金刚来了:“人”狗之间灵活切换 这是来自一家颇受关注的Swiss-Mile公司最新成果,它是在ETH的几名学者主导之下,由瑞士的一些机器人从业者联手创立。只要抬起前轮站立起来,它就变形成了“人”,两条前“腿”变成了“手臂”,完成开门取物等动作。网友看了之后说,也许以后送快递外卖都可以靠它了。那么,这只小机器狗都能做出什么样的动作呢?可用前轮充当手臂平时,它的四个轮子都用来行走,轮式的驱动方式也让行动变得更为迅速。上下楼梯、越过障碍时,动作既快速又平稳,没有因为采用轮式结构出现打滑或者刹不住车的情况。即使只靠后轮,它也能稳定地站立,在不摔倒的情况下完成行走、转向等操作。如果给予额外的支撑,它还可以把前肢当做手臂,稳稳地是抱起桌子上的箱子,然后放入一旁的筐中,或者抱着箱子行走……性能方面,机器狗的移动速度可达6米每秒,最高负重60公斤,电池续航长达5小时。那么,Swiss-Mile团队是如何让它们的机器狗“站起来工作”的呢?这款机器狗部署在Unitree Robotics硬件平台之上,是由ETH在2016年与ANYbotics联合推出的ANYmal机器狗改造而成的。他们给ANYmal添加了动力车轮,使其在移动效率和能力上都有所提升,并能应对楼梯、人行道等复杂环境。而为了让机器狗能够站立并完成开门等动作,团队通过一种名为“好奇心驱动”的强化学习方法对它进行了训练。在这种学习模式下,机器狗被给予一个目标(比如开门),然后要自行探索如何完成整个任务。具体来说,它需要不断探索和尝试不同的行动序列,比如调整肢体的动作和角度,直到成功完成任务。同时,这种学习方式引入了新的奖励机制,开门、搬箱子等动作被认为是高级别的目标,也称为“稀疏奖励(sparse rewards)”,意味着机器狗不会在完成整个任务的过程中收到任何鼓励或指导。这样的方法也提高了机器狗执行任务的可靠性和方式的多样性例如,如果在包裹搬运训练中发生了掉落,它可以自主学习如何重新拾起。背后团队获350万美元融资Swiss-Mile成立于2023年4月,CEO是ETH研究机器人的博士后Marko Bjelonic。Marko的博士生涯也是在ETH完成,其间的导师Marco Hutter教授也是公司联创,同时兼任顾问。此外,Swiss-mile的董事会中有两名华人成员,分别是担任董事的线性资本合伙人黄松延(Songyan Huang)和出任观察员的Agile Robots联合创始人赵悦凯(Yuekai Zhao)。同年12月,该公司获得了350万美元(约合2500万人民币)的种子轮融资,投资者包括Agile Robots、红杉中国和线性资本。 ... PC版: 手机版:

封面图片

外媒评Google I/O 2024:传统搜索日薄西山 谷歌全力重塑新模式

外媒评Google I/O 2024:传统搜索日薄西山 谷歌全力重塑新模式 此次大会上,Google宣布了其人工智能战略在各业务领域的全面落地。特别是,备受关注的Gemini聊天机器人获得了显著的功能增强,Google还对其核心搜索引擎进行了革命性的改进,目的是在与不断增强的人工智能竞争对手竞争中不落下风。具体而言,在大会上Google正式发布了多项新产品和服务:最新大语言模型Gemini1.5 Pro、针对快速响应场景的Gemini 1.5 Flash、参数量更大的开源模型Gemma 2、图像生成工具Imagen 3、视频生成模型Veo,以及在搜索引擎中新增的AIOverviews功能和实时人工智能助手。此外,Google还推出了第六代TPU芯片Trillium,为其人工智能应用提供了更强大的算力支持。关于此次GoogleI/O开发者大会的盛况,外国主流媒体纷纷发表评论。《华尔街日报》:Google新AI功能将重塑利润丰厚的互联网搜索业务Google将在年底前向其搜索引擎的数十亿用户展示由人工智能提供支持的答案,通过这种方式扩大该技术的应用范围,以应对其核心业务领域日益激烈的竞争。该策略已在本周在美国率先实施,这标志着Google对生成式人工智能技术的坚定支持。投资者和竞争对手普遍认为,这次更新不仅体现了Google对该技术的信心,也是其尝试重塑在线信息互动方式的一大步。这一举措将受到密切关注,因为它将深刻影响Google数千亿美元的广告销售业务,同时也会影响Google与网上内容提供商之间的关系,它们目前依赖搜索引擎流量。自OpenAI在2022年底推出ChatGPT以来,I/O开发者大会已成为Google展示其人工智能能力的重要平台,促使其加速推出竞争技术。Google的人工智能策略中,与其核心业务密切相关的新搜索功能尤为引人注目。Google一年前宣布了这一项目,此前,OpenAI的主要支持者微软已推出了使用人工智能以对话形式回答问题的必应搜索引擎版本。同时,如估值超过10亿美元的Perplexity等初创公司也推出了能够整合网络信息的类似工具。据悉,OpenAI正开发一款搜索产品,将与这些产品竞争。Google表示,本周将有数亿美国用户开始在搜索中看到AI Overviews,并预计到年底前,随着该功能在其他国家的推出,将有超过10亿用户体验到这一功能。此前,Google已在通过名为“搜索实验室”的项目注册的用户中测试了这些功能。投资者对Google搜索的任何变化都极为敏感,因为这些变化可能影响广告点击量。去年,去年,其母公司Alphabet收入高达3070亿美元,大部分来源于搜索结果旁的广告。为缓解投资者对人工智能解决方案成本增加的担忧,Alphabet CEO桑达尔·皮查伊(Sundar Pichai)上月在财报电话会上表示,自去年以来与人工智能摘要相关的搜索成本已下降了80%。这一转变也引起了新闻媒体和独立网站所有者的关注,他们依赖搜索引擎在读者面前展示自己。作为回应,Google承诺将优先向出版商提供流量。Google表示,与普通搜索结果相比,当链接被纳入AI Overviews时,人们点击它们的次数更多。然而,在推广这项技术时,Google表现出了极大的谨慎。目前,Google不打算在搜索页面上提供与人工智能聊天机器人进行长时间对话的功能,尽管这在用户测试中受到欢迎,并在去年的大会上进行了展示。《纽约时报》:Google迈出AI发展的下一步皮查伊去年5月表示,Google计划利用人工智能来重塑其全部产品线。然而,由于新的生成式AI技术可能传播虚假信息的风险,Google在将此技术应用于其庞大的搜索引擎时,采取了谨慎的态度。Google搜索引擎拥有超过20亿活跃用户,去年为Google创造了高达1750亿美元的收入。在加州山景城举行的Google开发者大会上,皮查伊详细介绍了Google如何逐步将人工智能技术融入其搜索引擎。他宣布,从本周起,美国用户将首次体验到一种名为AI Overviews的新功能,该功能在传统搜索结果之上提供信息摘要。预计到今年年底,全球将有超过10亿用户体验到这项先进技术。然而,AI Overviews的推出可能加剧内容提供商对流量减少的担忧,这些提供商已因与其他科技平台的分歧面临困境,而Google的新产品可能进一步加重这一压力。在Google搜索中,用户将看到某一主题的更详细摘要,这可能减少他们访问其他网站的需求,尽管Google试图淡化这些担忧。此外,Google还公布了其他战略举措,包括轻量级AI模型、新芯片及旨在帮助用户执行任务的智能主体等,以在与微软和OpenAI的人工智能竞赛中占据有利地位。皮查伊强调:“我们正处于人工智能平台转型的初期阶段。我们希望每个人都能从Gemini的能力中受益,无论是开发者、初创企业还是公众。”随着ChatGPT在2022年底横空出世,一些科技界人士认为这是对Google搜索引擎的严峻挑战,后者一直是最受欢迎的在线信息获取方式。自那以后,Google一直在努力重新夺回人工智能领域的领先地位,推出了一系列名为Gemini的技术。Google还将这项技术应用于YouTube、Gmail和Docs,帮助用户更轻松地创建视频、电子邮件和文档草稿。与此同时,Google与OpenAI及其合作伙伴微软的竞争仍在继续。在Google大会的前一天,OpenAI展示了一个更类似于语音助手的新版ChatGPT。在最新的活动中,Google展示了如何更深入地将人工智能融入用户的日常生活中。它推出了“阿斯特拉计划”(ProjectAstra),这是一项旨在探索人工智能作为智能主体与用户进行语音互动,并对图像和视频做出反应的实验。皮查伊预计,绝大多数人将通过Google搜索引擎与Gemini人工智能技术进行互动,“我们希望使人们与Gemini的互动变得更加无缝”。路透社:Alphabet推动增强版AI搜索和聊天机器人以应对竞争Google母公司Alphabet在周二详细介绍了如何在各业务领域深入整合人工智能。此举显著增强了其Gemini聊天机器人的功能,并对其著名的搜索引擎进行了革命性改进,目的是在人工智能领域与竞争对手进行正面较量。微软支持的OpenAI在2022年推出的ChatGPT引发了公众极大关注,这一突破性技术看似威胁到了Google在在线搜索和人工智能领域的长期领导地位。为应对此挑战,Google迅速推出了一系列新产品,展示其不断创新的决心。在Google此次全新进攻中,尤为引人注目的是名为Flash的Gemini 1.5 AI模型系列的新成员,这款模型具有更快的运行速度和更低的成本。此外,Google还展示了名为Project Astra的智能助手原型,该助手能与用户就智能手机摄像头实时捕捉到的内容进行对话。同时,Google推出了基于人工智能生成的标题来分类搜索结果,使搜索过程更加高效和精确。对于人工智能更新是否会对Google的盈利业务造成影响,皮查伊表示:“这是一个充满增长和机遇的时代。”OpenAI先前通过演示ChatGPT以类似人类的方式回答各种书面或视觉提示的能力,展示了其技术的先进性和实用性。OpenAI首席执行官萨姆·奥特曼(Sam Altman)甚至曾说,OpenAI提供的软件“感觉就像是电影中的人工智能”。Google的新举措也时常引发与OpenAI在人工智能领域的激烈竞争的讨论。作为Alphabet旗下的人工智能部门,GoogleDeepMind一直在开发能帮助消费者完成日常任务的技术。这些技术在Project Astra中得到了充分展示,该工具可以利用智能手机摄像头提供关于周围世界的信息概览,为用户的生活带来极大便利。Google在谈到Astra时表示:“我们的目标是建立一个通用的人工智能主体,它能够在日常生活中发挥真正的帮助作用。”市场研究机构eMarketer的分析师雅各布·伯恩(Jacob Bourne)指出:“本周发布的AI Overviews将成为衡量Google能否调整其搜索产品以适应生成式人工智能时代需求的重要指标。为... PC版: 手机版:

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人