just 具身智能和一个做人型机器人/具身智能的朋友交流了一下

just 具身智能 和一个做人型机器人/具身智能的朋友交流了一下 【四足小狗的意义】 像逐际动力、宇树科技这一类四足机器人企业,所面临的主要场景是电厂巡检。 我提出的问题是,如果单纯想目前pr中显示的,上几个楼梯,为什么不用导轨+摄像头+边缘盒子的方案? 主要的核心在于两点, 1.使用了巡检机器人,则工地的布置,行走检修的路线可以获得比较高的灵活度,而不是工厂一直就只能是那个装修和布局。 2.机器人的路线可以有差别,从而实现摄像机的不同视角,从而达到更好的拍摄密度,实现更精密的巡检。 【解耦+轮足一体】 其实机器人也可以和汽车一样实现上下解耦,包括研发线上也是,上半身执行器研究和下半身移动平台研究。理论上来讲,上半身基本是仿人的双执行器。而下半身其实是比较值得考究的。 双足的问题就在于仿真和控制效率不高,从而导致功耗较大,但优势在于一些复杂路况的翻越。但是大部分情况下没有这么复杂的路况。而轮胎型其实是功耗比较低的方案,比如北欧的机器人NEO。 因此,可以做一款轮足一体的移动平台。轮子放在小腿靠膝盖的地方,在不需要双足驱动的时候把轮子放下来变成轮子底盘。 【具身智能的难点-高水平电机,高性能线性执行器】 目前主要的难点还是聚焦于两块,一个是高性能线性执行器的设计,这一块类似于人类肌肉、关节形成一个锁定三角从而在人类负载的时候不需要持续做功。 另一个就是高性能的电机,主要还是在于瞬时最高扭矩无法达到。从而无法实现一些动作。除非通过一些外接的气动/液压等技术,才能做到一个瞬时释放能量。超级电容器也是一种思路,但是会比较大的损伤电机,就类似于目前电动汽车里轴承的电蚀现象 包括这种问题也会反应在执行速度上,指令可以很快,1000hz,但是执行会很慢(类似于你才踏板到汽车启动的一个过程,会有比较大的实质),得到反馈倒不慢,rl能到10-100hz 【具身智能的难点】 中国5G的基础建设还在进行中,5G基站覆盖面积短衰变大,而具身智能其实需要比较高的5G传输才能实现大模型和具身智能的交互。一旦有信号波动很有可能在执行层面实现误差。 因为边缘盒子最多承载几B的模型,而不是几百B的大模型。 这个可能是阻碍具身智能实现从B到C比较大的问题。换句话说目前具身智能,只有身,没有具。

相关推荐

封面图片

#人型 #机器人 #投资 #具身智能

#人型 #机器人 #投资 #具身智能 现在大家都在看人型机器人和具身智能,但都没搞明白投资具身机器人到底是投资什么。 现在我们看到大部分的投资,讲的故事都是说五年内会有居家性的机器人卖到消费者手上,但如果我们看现在实际的案例和学术理论这种假设是基本上没法成立的。 现在机器人技术上能解决的比较好的,就是1)如何在不同的环境能够维持平衡并且行动,这个包括轮式,双足、四足;2)还有就是不同自由度的机器臂进行预定好的,提前设置的,提前规划的移动。这种技术已经非常成熟了,所以在工业场景进行简单的搬运、组装、上下料,这个完全没有任何问题。 但是如果要进行在居家环境里面进行稍微比分拣不同东西更复杂的操作的话,现在还没有任何模型能够胜任。甚至现在去进行这些复杂动作的数积集和模型框架都不成熟。 现在generative人工智能之所以这么火,是因为在学术界有两个很大的突破,一个是attention is all you need (transformer), 另一个是latent diffusion。那大家可以想一想,在机器人和现实世界的互动中,就现在的理论知识去解决这个问题够吗? 这个突破还没出现。 那投资人实际应该去投资的是什么呢?答案是5年前类似openai的公司,openai在过去五年期间我一直关注,大家可能忘了,他们做了很多理论的突破,都没有寻求变现,而是去验证模型本身的可行性。我第一次关注到他们是在游戏里面,他们用强化学习模型打赢了星际争霸的韩国冠军。这个没有进行任何变现的技术突破,在后来的GPT 3.5模型的收敛和人工矫正aligment效果上面是有趣大贡献的,就是大家现在所谓的RLHF。第二次关注到他们是基因序列模型,Alpha fold,这个在医疗领域,当时是轰轰烈烈的大突破,但他们也没有将它进行直接变现。第三次关注到他们是GPT3语言大模型的发布,但这个模型出来后,他们也没有进行变现。我想说的是,学术领域的突破到实际应用的落地是需要接受很长一段时间的没有任何变现的(没有任何收入的)积累。

封面图片

华为云发布盘古具身智能大模型:“夸父”人形机器人亮相

华为云发布盘古具身智能大模型:“夸父”人形机器人亮相 据介绍,盘古大模型能够让机器人完成10步以上的复杂任务规划,并且在任务执行中实现多场景泛化和多任务处理。同时盘古大模型还能生成机器人需要的训练视频,让机器人更快地学习各种复杂场景。大模型的多模态能力以及思维能力的快速提升,使机器人能够模拟人类常识进行逻辑推理,并在现实环境中高效精准地执行任务,从而有效解决了复杂环境感知与物理空间认知的难题。通过集成多场景泛化和多任务处理能力,不论是生活场景还是工业场景,都能游刃有余的应对。大会现场展示中,“夸父”可以通过识别物品、问答互动、击掌、递水等互动演示,直观展示了双方基于盘古大模型的合作成果。通过模仿学习策略显著提升了人形机器人的双臂操作能力,实现了软硬件层面的协同优化,不仅增强了机器人综合性能,还克服了小样本数据训练的局限性,推动了泛化操作能力的边界。张平安在大会上表示,除了人形机器人,盘古具身智能大模型还可以赋能多种形态的工业机器人和服务机器人,让它们帮助人类去从事危险和繁重的工作。具身智能大模型可以让机器人作用更加广泛,未来真正实现让AI机器人帮助我们去洗衣、做饭、扫地,让我们有更多的时间去看书,写诗,作画。 ... PC版: 手机版:

封面图片

昨天闭门会我的观点1、具身智能和机器人的区别:具身智能的核心是通用的脑子。没脑子前就做硬件,很可能就是错的。

昨天闭门会我的观点 1、具身智能和机器人的区别:具身智能的核心是通用的脑子。没脑子前就做硬件,很可能就是错的。 2、具身智能最后一定会是人形,因为能适配人类的工具链和环境。未来机器人分两种:替代人的具身智能(通用人形机器人)、升级版的智能设备。 3、现在的国内问题在哪?1还没脑子,2陷入物理世界的迭代 4、应该怎么做?欢迎来参加闭门会,明晚(周二)北京中关村

封面图片

宇树科技 CEO:具身智能是实现 AGI 的最有效途径,AGI 需要实物机器人的交互才能强化学习

宇树科技 CEO:具身智能是实现 AGI 的最有效途径,AGI 需要实物机器人的交互才能强化学习 7 月 4 日,2024 世界人工智能大会,宇树科技 CEO 王兴兴表示:“具身智能是实现 AGI 的最有效途径,OpenAI 的大方向大概率是错的。” 他认为,未来 5-10 年肯定会有很大的技术突破,只有尽可能地相信 AI,才会有更好的未来。王兴兴表示,对于具身智能而言,能够理解时间、空间以及物理规律的世界模型非常重要,“现在的大语言模型等很像活在梦里”,AGI 需要有实物机器人的物理交互才能加深模仿和强化学习,同时也需要参与到人类的生活中,来体验和理解人类的情绪和性格。对于未来发展,王兴兴表示,深度强化学习还可以在全身任意姿态或舞蹈等动作的模仿深度强化学习、复杂地形下的全身任意稳定运动、手部的复杂物品或零部件较复杂的灵巧操作,以及基于图像或深度数据等感知数据的强化学习导航避障等方面取得更大突破。(澎湃新闻记者 秦盛 实习生 张宸玚)

封面图片

【清华大学副教授眭亚楠:大语言模型与具身智能具有强互补性】

【清华大学副教授眭亚楠:大语言模型与具身智能具有强互补性】 10 月 26 日,在 2023REAL 科技大会上,清华大学副教授眭亚楠表示,大语言模型与具身智能是强互补性的,大语言模型已经很大程度解决了感知问题,可以提升具身智能的研究和转化前沿。机器领域的感知来自于视觉,由于视觉的快速提升,使得具身智能和机器人的能力也在快速提升。接下来几年,随着语言能力,机器人的控制、规划能力也在快速提升,大语言模型和多模态能力,更会让具身智能进一步提升。 快讯/广告 联系 @xingkong888885

封面图片

今年的机器人开发者大会论坛感受下来,国产具身智能企业各有特点,十分有意思

今年的机器人开发者大会论坛感受下来,国产具身智能企业各有特点,十分有意思 1. 傅里叶智能,CEO顾捷饱含情怀,十几年如一日摸索落地形态与场景,最新人形机器人小批量量产100台 2. 智元机器人,头顶天才少年光环万众瞩目,成立一年多以来还是在本体和机械层面优化中,且看沿途下蛋会交付什么出来吧 3. 银河通用,十分接近我对AGI的想法,合成数据训练小模型GPT的大模型,操作加学习清晰明了,不愧是BAAI合作单位 4. 达闼机器人,搞了套机器人OS,机器人技术表现很一般,未来就卖操作系统?听说是最有可能先上市的机器人公司 5. 科大讯飞,像PPT路演的,一直营销自家的多模态。有模型有智能硬件,离机器人有多远?

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人